RAID - Redundant Array of Independent (oder inxpensive) Disks

 RAID steht für "Redundant Array of Independent Disks" - auf Deutsch: "Ueberzähliger Verbund von unabhängigen Platten" - und bezeichnet einen zusammenhängenden Verbund einzelner Festplatten.

Gebräuchlich ist auch die Bezeichnung "Redundant Array of Inexpensive Disks" - insbesondere dann, wenn kostengünstige ("inexpensive") IDE oder S-ATA Laufwerke zur Bildung eines RAID´s herangezogen werden.

Im Vordergrund steht bei RAID die Redundanz (die "Überzähligkeit"). Dies bedeutet, gleiche Daten sind auf verschiedenen Laufwerken vorhanden. Dies beugt einem Datenverlust vor.

HDD´s können in vielfältigster Art und Weise zu einem Volume oder Verbund zusammengefügt werden. Insgesamt gibt es 8 so genannte RAID-Level. RAID 0 bis 7. Ausserdem gibt es Mischformen aus den einzelnen RAID-Levels (RAID 10 und 0+1). Die gebräuchlichsten RAID-Levels: 0, 1, 5 sowie RAID 10 und 0+1.

Was bedeuten die einzelnen RAID-Level:

RAID-0 oder StripeSet
Es werden mindestens zwei Platten zu einem logischen Volume zusammengefasst.
Vorteil: optimale Nutzung der gesamten Kapazität aller beteiligten Laufwerke bedingt durch einen erhöhten Datendurchsatz. Erreicht wird der erhöhte Datendurchsatz durch ein sequentielles Lesen und Schreiben von/auf den Platten.

Dies bedeutet, dass die zu speichernden Daten werden in Blöcke aufgeteilt und auf die dem RAID-0 zugeordneten Platten verteilt und somit gespeichert werden.
Unter Windows NT/XP/2000/2003 kann auch ein Software RAID-0 gebildet werden. Dies erreicht jedoch nicht die gleiche Performance wie ein über ein RAID-Controller gebildetes Stripe-Set (fehlendes seq. Lesen und Schreiben).

Bei einem RAID-0 trifft die Bezeichnung RAID allerdings nicht richtig zu, da es keine Redundanz gibt.

Fällt eine Platte im Stripe-Set aus, ist das gesamte Stripe-Set unbrauchbar. In wirklichkeit birgt ein RAID-0 sogar ein höheres Risiko, da sich die MTBF verringert. Sogar bei einem StripSet aus 2 HDD´s halbiert sie sich bereits (Mean Time Between Failere = Mittlere Ausfall Zeit).

RAID-1
Der erste RAID-Level der diese Bezeichnung auch zurrecht trägt heist Mirroring/Duplexing (Spiegelung) oder RAID-1. Alle Daten eines Laufwerkes oder Volumes werden auf eine Zweite HDD oder Volume gespielt. Diese Spiegelung stellt einen einfachen aber sehr effizienten Schutz und somit eine gesteigerte Systemverfügbarkeit dar. Ein defektes Laufwerk kann im laufenden Betrieb (Hot-Swap vorrausgesetzt) getauscht und regeneriert werden (die Daten werden auf das neu eingesetzte Laufwerk gespielt). Werden 2 Festplatten mit einem Controller - demselben I/O-Kanal - verwendet, spricht man von Mirroring (Spiegelung), werden 2 Controller oder I/O-Kanäle verwendet, nennt man dies Duplexing (die teuerste Lösung).

RAID-2
Bei einem RAID-2 werden Daten werden in Bitfolgen fester Größe zerlegt mit Hilfe eines Hamming-Codes größere Bitfolgen abgebildet. Die einzelnen Bits des Hamming-Codeworts werden anschließend über einzelne Platten gestripet. Dies erlaubt einen hohen Datendurchsatz, birgt jedoch den Nachteil in sich, dass die Anzahl der Platten ein mehrfaches der Hamming-Codewortlänge sein muss. Ein weitere Nachteil - wie auch schon beim RAID-0 - ist, dass beim Ausfall einer HDD das gesamte Volume unbrauchbar wird. Das Wort RAID ist also in seiner ursprünglichen Bedeutung falsch, da bei RAID-2 keine Redundanz vorliegt und dies im Normalfall der Sinn und Zweck eines RAID-Volumes ist.

RAID-3
Bei einem RAID-3 werden die Nutzdaten byteweise über einzelne HDD´s gestripet. Eine zusätzliche HDD nimmt die Paritätsdaten auf die sich aus einer XOR Verknüpfung der einzelnen Datenbytes ergeben. Da die paritätsplatte in diesem System einen Flaschenhals darstellt, ist ein RAID-3 nicht sonderlich effizient. Des weiteren werden in neueren Systemen I/O-Operationen mit Blockgrößen bis hin zu mehreren MBytes ermöglicht, wie Sie bei RAID-4 und RAID-5 realisiert wurden.

RAID-4
Bei einem, RAID-4 werden - wie im RAID-3 - auch Paritäts-Informationen berechnet und auf eine gesondertete Paritäts-HDD geschrieben. Die zu schreibenden Chunks sind jedoch nicht einzelnen Bytes sondern weitaus größere Einheiten - dies ist auch beim RAID-5 der Fall. Jedoch wird anstelle eines RAID-4 immer ein RAID-5 bevorzugt, da aufgrund der nicht erforderlichen Paritätsplatte beim RAID-5 kein Flaschenhals beim I/O-Operationen vorhanden ist.

RAID-5
Dieser RAID-Level verwendet das Prinzip des Data-Striping (StripeSet) mit verteilten Paritätsinformationen. Sie benötigen zur Bildung eines RAID-5 Datenträgers mindestens drei Festplatten. Der RAID-Controller übernimmt nun die Berechnung der für die Redundanz benötigten Paritätsdaten und verteilt diese auf die 3 Festplatten. Beim Ausfall eines Laufwerkes gibt das System eine Warnung im Ereignisprotokoll und - sofern konfiguriert - per E-Mail oder SMTP aus. Das System arbeitet jedoch unbeeindruckt und mit fast voller Performance weiter. Erst durch den Ausfall einer weiteren Festplatte im RAID-5 Datenträger gehen die Daten vollständig verloren. Ein einzelner Datenträger kann im luafenden Betrieb (Hot-Swap vorausgesetzt) getauscht werden. Nach erolgtem Austausch einer defekten Festplatte errechnet das System aus den auf den anderen Platten gespeicherten Paritätsinformationen die Daten der fehlenden Platte und stellt diese wieder her. Währen des Rebuild-Prozesses kann mit dem System mit einer verringerten Performance weitergearbeitet werden.

RAID-6
In einem RAID-6 wird versicht, eine Steigerung der Ausfallsichehrheit gegenüber einem RAID-5 zu erreichen. Dies wird dadurch erreicht, dass ein zusätzliches Parity-Laufwerk zum Einsatz kommt. Dieses Parity-Drive stellt sicher, dass selbst beim Ausfall von 2 Festplatten das RAID-Volume noch funktionsfähig bleibt. Man erkauft sich diese gesteigerte Sicherheit jedoch durch eine enorme Leistungseinbuße - langsamere Schreibzugriffe !!!

RAID-7
Dieser RAID-Level ist ähnlich RAID-5. Als Unterschied zu RAID-5 läuft hierbei jedoch im Controller ein lokales Echtzeitbetriebssystem welches die Lese- und Schreiboperationen steuert. Ein RAID-7 benutzt zusätzlich schnelle Datenbusse und mehrere Pufferspeicher, die wiederum von der Datenübertragung auf dem Bus abgekoppelt sind und somit asynchron arbeiten. Durch die die beschrieben Hardwarekonfiguration erreicht RAID-7 eine sehr hohe Performance und Sicherheit - ist jedoch auch die teuerste aller Lösungen.

RAID-10
Mirrored Striping vereint die Vorteile von RAID 0 und 1 - Sicherheit mit sequentieller Performance. Machnmal wird dieser RAID-Level auch 01 bennannt. Sie benötigen mindestens 4 Festplatten da das RAID10 aus 2 Paaren gespiegelter Arrays besteht.

RAID-30
Kommt zum Einsatz bei der sequentiellen Übertragung großer Datenmengen. Ein RAID 30 ist die gestripte Version eines RAID-3. Entwickelt wurde RAID-30 von AMI (American Megatrends). Ein RAID-30 kombiniert hohe Datensicherheit mit hohem Datendurchsatz. AMI benutzt für ein RAID 30 sechs Festplatten.

RAID-50
Große Datensicherheit wie auch schnelle Zugriffszeiten und hohe Datentransferraten - benötigt ebenfalls sechs Festplatten. RAID 50 ist die gestripte Version von RAID 5. Auch RAID-50 wurde von AMI entwickelt.



Hamming-Code
Ein Code, der so viel Information enthält, dass ein auftretender Fehler entdeckt und zugleich korrigiert werden kann, wird als selbstkorrigierender Code (error correcting code) bezeichnet.

CHUNK = Brocken, Klotz:
Es gibt Kontroller in welchem die Chunk-Größe angegeben werden kann. Die Chunk-Size gibt die Größe an, in die eine Datei in Blöcke zerlegt und anschliessend auf den RAID-Datenträger geschrieben wird. Diese ist nicht mit der Blockgröße zu verwechseln, die beim Formatieren des RAID-Verbundes als Parameter eines bestimmten Dateisystems angegeben werden kann. Die Blocksize und Chunk-Size kann variabel verwendet werden und bringen je nach Nutzung unterschiedliche Geschwindigkeitsvor- oder auch Nachteile


Wenn Sie Fragen haben oder mit einem Repräsentanten von STEITZ® IT-Solutions sprechen möchten, setzen Sie sich mit uns in Verbindung.