
RAID
steht für "Redundant Array of Independent
Disks" - auf Deutsch: "Ueberzähliger Verbund von unabhängigen
Platten" - und bezeichnet einen zusammenhängenden Verbund einzelner
Festplatten.
Gebräuchlich ist auch die Bezeichnung "Redundant
Array of Inexpensive Disks" - insbesondere dann, wenn kostengünstige
("inexpensive") IDE oder S-ATA Laufwerke zur Bildung eines RAID´s
herangezogen werden.
Im Vordergrund steht bei RAID die Redundanz (die "Überzähligkeit").
Dies bedeutet, gleiche Daten sind auf verschiedenen Laufwerken
vorhanden. Dies beugt einem Datenverlust vor.
HDD´s können in vielfältigster Art und Weise zu einem Volume oder
Verbund zusammengefügt werden. Insgesamt gibt es 8 so genannte
RAID-Level. RAID 0 bis 7. Ausserdem gibt es Mischformen aus den
einzelnen RAID-Levels (RAID 10 und 0+1). Die gebräuchlichsten
RAID-Levels: 0, 1, 5 sowie RAID 10 und 0+1.
Was bedeuten die einzelnen RAID-Level:
RAID-0 oder StripeSet
Es werden mindestens zwei Platten zu einem logischen Volume
zusammengefasst.
Vorteil: optimale Nutzung der gesamten Kapazität aller beteiligten
Laufwerke bedingt durch einen erhöhten Datendurchsatz. Erreicht wird
der erhöhte Datendurchsatz durch ein sequentielles Lesen und
Schreiben von/auf den Platten.
Dies bedeutet, dass die zu speichernden Daten
werden in Blöcke aufgeteilt und auf die dem RAID-0 zugeordneten
Platten verteilt und somit gespeichert werden.
Unter Windows NT/XP/2000/2003 kann auch ein Software RAID-0 gebildet
werden. Dies erreicht jedoch nicht die gleiche Performance wie ein
über ein RAID-Controller gebildetes Stripe-Set (fehlendes seq. Lesen
und Schreiben).
Bei einem RAID-0 trifft die Bezeichnung RAID allerdings nicht richtig zu, da es keine Redundanz gibt.
Fällt eine Platte im Stripe-Set aus, ist das
gesamte Stripe-Set unbrauchbar. In wirklichkeit birgt ein RAID-0
sogar ein höheres Risiko, da sich die MTBF verringert. Sogar bei
einem StripSet aus 2 HDD´s halbiert sie sich bereits (Mean Time
Between Failere = Mittlere Ausfall Zeit).
RAID-1
Der erste RAID-Level der diese Bezeichnung auch zurrecht trägt heist
Mirroring/Duplexing (Spiegelung) oder RAID-1. Alle Daten eines
Laufwerkes oder Volumes werden auf eine Zweite HDD oder Volume
gespielt. Diese Spiegelung stellt einen einfachen aber sehr
effizienten Schutz und somit eine gesteigerte Systemverfügbarkeit
dar. Ein defektes Laufwerk kann im laufenden Betrieb (Hot-Swap
vorrausgesetzt) getauscht und regeneriert werden (die Daten werden
auf das neu eingesetzte Laufwerk gespielt). Werden 2 Festplatten mit
einem Controller - demselben I/O-Kanal - verwendet, spricht man von
Mirroring (Spiegelung), werden 2 Controller oder I/O-Kanäle
verwendet, nennt man dies Duplexing (die teuerste Lösung).
RAID-2
Bei einem RAID-2 werden Daten werden in Bitfolgen fester Größe
zerlegt mit Hilfe eines Hamming-Codes größere Bitfolgen abgebildet.
Die einzelnen Bits des Hamming-Codeworts werden anschließend über
einzelne Platten gestripet. Dies erlaubt einen hohen Datendurchsatz,
birgt jedoch den Nachteil in sich, dass die Anzahl der Platten ein
mehrfaches der Hamming-Codewortlänge sein muss. Ein weitere Nachteil
- wie auch schon beim RAID-0 - ist, dass beim Ausfall einer HDD das
gesamte Volume unbrauchbar wird. Das Wort RAID ist also in seiner
ursprünglichen Bedeutung falsch, da bei RAID-2 keine Redundanz
vorliegt und dies im Normalfall der Sinn und Zweck eines RAID-Volumes
ist.
RAID-3
Bei einem RAID-3 werden die Nutzdaten byteweise über einzelne HDD´s
gestripet. Eine zusätzliche HDD nimmt die Paritätsdaten auf die sich
aus einer XOR Verknüpfung der einzelnen Datenbytes ergeben. Da die
paritätsplatte in diesem System einen Flaschenhals darstellt, ist
ein RAID-3 nicht sonderlich effizient. Des weiteren werden in
neueren Systemen I/O-Operationen mit Blockgrößen bis hin zu mehreren
MBytes ermöglicht, wie Sie bei RAID-4 und RAID-5 realisiert wurden.
RAID-4
Bei einem, RAID-4 werden - wie im RAID-3 - auch
Paritäts-Informationen berechnet und auf eine gesondertete
Paritäts-HDD geschrieben. Die zu schreibenden Chunks sind jedoch
nicht einzelnen Bytes sondern weitaus größere Einheiten - dies ist
auch beim RAID-5 der Fall. Jedoch wird anstelle eines RAID-4 immer
ein RAID-5 bevorzugt, da aufgrund der nicht erforderlichen
Paritätsplatte beim RAID-5 kein Flaschenhals beim I/O-Operationen
vorhanden ist.
RAID-5
Dieser RAID-Level verwendet das Prinzip des Data-Striping (StripeSet)
mit verteilten Paritätsinformationen. Sie benötigen zur Bildung
eines RAID-5 Datenträgers mindestens drei Festplatten. Der
RAID-Controller übernimmt nun die Berechnung der für die Redundanz
benötigten Paritätsdaten und verteilt diese auf die 3 Festplatten.
Beim Ausfall eines Laufwerkes gibt das System eine Warnung im
Ereignisprotokoll und - sofern konfiguriert - per E-Mail oder SMTP
aus. Das System arbeitet jedoch unbeeindruckt und mit fast voller
Performance weiter. Erst durch den Ausfall einer weiteren Festplatte
im RAID-5 Datenträger gehen die Daten vollständig verloren. Ein
einzelner Datenträger kann im luafenden Betrieb (Hot-Swap
vorausgesetzt) getauscht werden. Nach erolgtem Austausch einer
defekten Festplatte errechnet das System aus den auf den anderen
Platten gespeicherten Paritätsinformationen die Daten der fehlenden
Platte und stellt diese wieder her. Währen des Rebuild-Prozesses
kann mit dem System mit einer verringerten Performance
weitergearbeitet werden.
RAID-6
In einem RAID-6 wird versicht, eine Steigerung der
Ausfallsichehrheit gegenüber einem RAID-5 zu erreichen. Dies wird
dadurch erreicht, dass ein zusätzliches Parity-Laufwerk zum Einsatz
kommt. Dieses Parity-Drive stellt sicher, dass selbst beim Ausfall
von 2 Festplatten das RAID-Volume noch funktionsfähig bleibt. Man
erkauft sich diese gesteigerte Sicherheit jedoch durch eine enorme
Leistungseinbuße - langsamere Schreibzugriffe !!!
RAID-7
Dieser RAID-Level ist ähnlich RAID-5. Als Unterschied zu RAID-5
läuft hierbei jedoch im Controller ein lokales
Echtzeitbetriebssystem welches die Lese- und Schreiboperationen
steuert. Ein RAID-7 benutzt zusätzlich schnelle Datenbusse und
mehrere Pufferspeicher, die wiederum von der Datenübertragung auf
dem Bus abgekoppelt sind und somit asynchron arbeiten. Durch die die
beschrieben Hardwarekonfiguration erreicht RAID-7 eine sehr hohe
Performance und Sicherheit - ist jedoch auch die teuerste aller
Lösungen.
RAID-10
Mirrored Striping vereint die Vorteile von RAID 0 und 1 - Sicherheit
mit sequentieller Performance. Machnmal wird dieser RAID-Level auch
01 bennannt. Sie benötigen mindestens 4 Festplatten da das RAID10
aus 2 Paaren gespiegelter Arrays besteht.
RAID-30
Kommt zum Einsatz bei der sequentiellen Übertragung großer
Datenmengen. Ein RAID 30 ist die gestripte Version eines RAID-3.
Entwickelt wurde RAID-30 von AMI (American Megatrends). Ein RAID-30
kombiniert hohe Datensicherheit mit hohem Datendurchsatz. AMI
benutzt für ein RAID 30 sechs Festplatten.
RAID-50
Große Datensicherheit wie auch schnelle Zugriffszeiten und hohe
Datentransferraten - benötigt ebenfalls sechs Festplatten. RAID 50
ist die gestripte Version von RAID 5. Auch RAID-50 wurde von AMI
entwickelt.
Hamming-Code
Ein Code, der so viel Information enthält, dass ein auftretender
Fehler entdeckt und zugleich korrigiert werden kann, wird als
selbstkorrigierender Code (error correcting code) bezeichnet.
CHUNK = Brocken, Klotz:
Es gibt Kontroller in welchem die Chunk-Größe angegeben werden kann.
Die Chunk-Size gibt die Größe an, in die eine Datei in Blöcke
zerlegt und anschliessend auf den RAID-Datenträger geschrieben wird.
Diese ist nicht mit der Blockgröße zu verwechseln, die beim
Formatieren des RAID-Verbundes als Parameter eines bestimmten
Dateisystems angegeben werden kann. Die Blocksize und Chunk-Size
kann variabel verwendet werden und bringen je nach Nutzung
unterschiedliche Geschwindigkeitsvor- oder auch Nachteile
Wenn Sie Fragen haben oder mit einem Repräsentanten von STEITZ® IT-Solutions sprechen möchten, setzen Sie sich mit uns in Verbindung.