Hintergrundinformationen zu RAID

Written By: Ontrack

Date Published: 7. August 2023 04:27:11 EDT

Hintergrundinformationen zu RAID

Was ist eigentlich RAID?

Die RAID-Speichertechnologie (Redundant Array of Independent (ursprünglich Inexpensive) Disks) hat die Datenspeicherung in Unternehmen revolutioniert, da sie die Sicherheit der Redundanz (ab RAID 1) bietet, die Ausfallzeiten aufgrund von Fehlern einzelner Laufwerke erheblich reduzieren kann.

Jedoch ist die RAID-Speicherung keine perfekte Technologie, so dass es immer noch zu Datenverlust kommen kann.

Die Definition von RAID findet sich im Namen des Systems selbst. RAID steht für Redundant Array of Independent Disks (Redundante Anordnung unabhängiger Festplatten) und bedeutet wörtlich übersetzt redundante Bündelung unabhängiger Festplatten - ein Verbund mehrerer Festplatten, um eine einzige logische Partition zu erhalten. Je nach Verwendungszweck erhöht ein RAID-System die Leistung beim Zugriff die Daten und beim Schreibvorgang und bietet gleichzeitig mehr Datensicherheit.

RAID ist eine Technologie, die die Verwendung von zwei oder mehr Festplatten in verschiedenen Konfigurationen unterstützt, um durch die Konsolidierung von Festplattenressourcen und Paritätsberechnungen eine höhere Leistung, Zuverlässigkeit und größere Volumen zu erreichen.

Es wurde eine Reihe von Standardkonfigurationen entwickelt, die als Levels bezeichnet werden. Ursprünglich gab es fünf RAID-Levels, aber es haben sich viele weitere Variationen entwickelt, insbesondere mehrere verschachtelte Levels und viele nicht standardisierte Levels (meist proprietär).

Was bedeuten also die RAID-Levels? Die Zahlen beziehen sich einfach auf die Konfiguration des RAIDs. Da alle RAID-Systeme Daten effizient speichern, hängt die Wahl des Systems von Ihren persönlichen Bedürfnissen ab. Das RAID 1 beispielsweise erfüllt die Anforderungen an Leistung und Zuverlässigkeit. Das RAID 5 ist eine geeignete Lösung, wenn Sie sowohl auf Leistung als auch auf Fehlertoleranz Wert legen.

 
what-is-raid

RAID-System Übersicht

RAID ist ein Begriff, der für Computerspeichersysteme verwendet wird, die Daten auf mehrere Festplattenlaufwerke verteilen oder replizieren. RAID wurde mit zwei Hauptzielen entwickelt: Erhöhung der Datenzuverlässigkeit und Steigerung der E/A-Leistung (Input/Output).

Ein RAID kombiniert physische Festplatten zu einer einzigen logischen Einheit, indem es entweder spezielle Hardware oder Software verwendet. Hardware-RAID-Lösungen gibt es in verschiedenen Ausführungen, von auf der Hauptplatine eingebauten Karten bis hin zu großen NAS- oder SAN-Servern für Unternehmen. Bei diesen Konfigurationen hat das Betriebssystem keine Kenntnis von der technischen Funktionsweise des RAID-Systems. Softwarelösungen werden in der Regel in das Betriebssystem implementiert.

Bei RAID gibt es drei Schlüsselkonzepte:

  • Spiegelung, das Kopieren von Daten auf mehr als eine Festplatte
  • Striping, die Aufteilung von Daten auf mehr als eine Festplatte
  • Fehlerkorrektur, bei der redundante Daten gespeichert werden, damit Probleme erkannt und möglicherweise behoben werden können (bekannt als Fehlertoleranz)
Verschiedene RAID-Levels verwenden je nach den Systemanforderungen eine oder mehrere dieser Techniken.

RAID wird traditionell auf Servern eingesetzt, kann aber auch auf Workstations verwendet werden. Letzteres gilt insbesondere für speicherintensive Computer, wie sie für die Video- und Audiobearbeitung verwendet werden.
 
 
raid-recovery-tips

Geschichte des RAID-Systems

RAID ist die Abkürzung für Redundant Array of Inexpensive Disks (Redundant Array of Independent Disks). Das Konzept wurde an der University of California, Berkeley, entwickelt, wo David A. Patterson, Garth Gibson und Randy H. Katz zusammenarbeiteten, um funktionsfähige Prototypen von RAID-Speichersystemen mit fünf Ebenen herzustellen. Das Ergebnis ihrer Forschung bildete die Grundlage für die komplexen RAID-Speichersysteme, die heute existieren. Heute hält IBM die geistigen Eigentumsrechte an RAID 5.

Die Entwicklung des RAID-Speichersystems zielte darauf ab, die Leistung, Wiederherstellung, Zuverlässigkeit und Skalierbarkeit der Speicherung zu verbessern. Das Ergebnis war ein einzigartiges Redundanzkonzept, das die Wiederherstellung von Daten ermöglicht, wenn ein Laufwerk im System ausfällt. RAID-Kontrollerkarten sind in der Lage, Daten auch dann noch zu lesen und zu schreiben, wenn eine Festplatte "offline" ist.

 

Die verschiedenen Arten von RAID

Ontrack bietet Datenwiederherstellungsdienste für alle wichtigen RAID-Architekturen an. Dazu gehören die RAID-Level 0, 00, 1, 10, 1E, 1E0, 2, 3, 4, 5, 50, 5E, 5EE, 6 und 60. Wir arbeiten auch für eine große Anzahl von proprietären RAID-Arrays.

Durch die kontinuierliche Weiterentwicklung unserer Software-Tools stellen wir sicher, dass wir die neuesten State-of-the-Art- und proprietären Techniken einsetzen, um die bestmögliche Datenwiederherstellung zu erreichen. Darüber hinaus unterstützt das Forschungs- und Entwicklungsteam unsere Techniker bei der Datenwiederherstellung, wenn sie mit ungewöhnlichen proprietären RAID-Arrays konfrontiert werden, durch speziell für diesen Anlass entwickelte Tools.

Wir werden von den meisten RAID-Anbietern wie HP, Compaq, Dell, Adaptec, IBM, Intel, Promise, LSI Logic, Mylex, Xiotech und Netsan empfohlen. Alle haben ihre eigene RAID-Konfiguration, eine bestimmte Datenblockgröße, eine Paritätsgröße und eine einzigartige Symmetrie.

Unsere RAID-Wiederherstellungsfähigkeiten beschränken sich nicht nur auf NTFS, sondern erstrecken sich auch auf MAC-, UNIX-, FAT- und VMware-RAIDs.

Die RAID-Konfiguration, einschließlich der Anzahl der verwendeten Festplatten, bestimmt den Typ. Zur Erinnerung: RAID steht für Redundant Array of Independent Disks oder Redundant Independent Disk Array und ist eine Speicherlösung, bei der die Daten auf mehrere kleine Festplatten verteilt werden, die zusammen ein einziges System bilden. Dieses Gerät ist nicht nur kostengünstiger, sondern bietet auch ein hohes Maß an Leistung und Datensicherheit, da RAID Ausfälle besser verkraftet.

Heute gibt es fast zwanzig Arten von RAID, wenn nicht sogar noch mehr, darunter auch Konfigurationen, die manchmal als veraltet gelten, wie z. B. das RAID 2. Von all diesen RAID-Konfigurationen sind RAID 0, RAID 1, RAID 10, RAID 2, RAID 3 und 4, RAID 5 oder RAID 6 die gängigsten.

RAID 0 ist ein System, das nur zwei Festplatten verwendet und einen schnellen Zugriff auf die Daten ermöglicht. RAID 1 verwendet ebenfalls zwei Festplatten und schreibt doppelte Informationen. Wenn eine der Festplatten beschädigt ist, finden Sie Ihre Daten auf der anderen wieder. Um von der Leistung von RAID 0 und der Sicherheit von RAID 1 zu profitieren, wurde RAID 5 entwickelt. Mit einer guten Verteilung der Daten kombiniert RAID 5 Geschwindigkeit und Fehlertoleranz. RAID 6 hat die gleichen Vorteile wie RAID 5, bietet aber zusätzlich eine höhere Schreibgeschwindigkeit.

 

RAID 0
RAID 0 ist die klassische Datenstripping-Konfiguration, bei der die Daten auf alle Laufwerke geschrieben werden, was einen schnelleren Zugriff ermöglicht. Diese Leistung birgt jedoch ein Risiko: Wenn eine oder mehrere Festplatten in einem RAID 0 eine Katastrophe verursachen, kann es zu einem ernsthaften Datenverlust kommen. Das folgende Diagramm zeigt, wie die Daten über die Matrix verteilt sind.

Ein Beispiel für eine Datenwiederherstellung: Es wurde eine Datei erstellt, die die Datenstripes 1 - 4 belegt. Wenn Laufwerk 2 ausfällt und der zweite Stripe verloren geht, wird die Datei höchstwahrscheinlich beschädigt. Oder anders ausgedrückt: Wenn ein Laufwerk ausfällt, müsste die größtmögliche Datei kleiner sein als die Größe der verbleibenden Stripes zusammen.
 
RAID 1
Bei diesem RAID-Level werden die Daten auf der primären Festplatte auf der anderen dupliziert. Bei diesem RAID gibt es keine Leistungssteigerung, aber wenn ein Laufwerk ausfällt, haben Sie eine Sicherungskopie auf dem zweiten Laufwerk.
 

RAID 2

 

RAID 2 umfasst Daten-Striping auf Bitebene mit einem dedizierten Paritätslaufwerk. Diese Ebene verwendet Hamming-Fehlererkennungscodes und ist für die Verwendung auf Laufwerken gedacht, die keine integrierte Fehlererkennung haben. Aus diesem Grund wird RAID 2 nicht mehr häufig verwendet.

 

RAID 3 and 4

 

RAID 3 und 4 verwenden beide Striping mit einem dedizierten Paritätslaufwerk. Der Unterschied zwischen den beiden besteht darin, dass RAID 3 Stripes auf Byteebene und RAID 4 Stripes auf Blockebene verwendet. RAID 3 wird heutzutage aufgrund der schlechten Leistung von Striping auf Byte-Ebene selten verwendet, RAID 4 ist besser mit Striping auf Blockebene, leidet aber immer noch unter einer langsameren Schreibleistung, da die Parität bei jedem Schreibvorgang aktualisiert werden muss.

 

RAID 5
RAID 5 gilt allgemein als der beste Kompromiss zwischen Fehlertoleranz, Geschwindigkeit und Kosten. Das System teilt die Daten auf die gleiche Weise wie ein RAID 0 auf, verteilt aber auch die Paritätsdaten auf alle Festplatten, aus denen es besteht.  Jeder Anbieter hat seine eigene spezifische Art, Paritätsinformationen auf Festplatten zu verteilen, aber es wird fast immer eine dieser vier Arten sein: links asymmetrisch, links symmetrisch, rechts asymmetrisch und rechts symmetrisch.

Die Richtung der Parität ist einfach zu identifizieren, da Sie sehen können, dass sie sich sowohl nach rechts als auch nach links "bewegt". Bei asymmetrischen RAIDs ignorieren die Stripes die Parität, sie überspringen sie, bis sie den nächsten verfügbaren Speicherplatz erreichen.

Symmetrische RAIDs handhaben Data Stripes etwas komplexer, sobald die Daten auf einen Paritätsblock treffen, bewegen sie sich seitwärts und nach unten zum nächsten Stripe Set.
 
RAID 6
Das RAID-6-System ist eine Erweiterung des RAID-5-Systems: Es führt dieselbe Datenverteilung durch und verwendet eine ähnliche Paritätsaufteilung, erzeugt aber einen zusätzlichen Datenblock für jeden Stripe. Auf diese Weise erleidet das RAID selbst bei einem gleichzeitigen Ausfall von zwei Festplatten keinen Datenverlust. Bei kleineren RAIDs ist die Möglichkeit, dass zwei Festplatten gleichzeitig ausfallen, geringer, aber mit zunehmender Größe des RAID-Verbunds steigt die Wahrscheinlichkeit von Ausfällen. 

Was die Leistung anbelangt, so ist sie der von RAID 5 sehr ähnlich: Die Schreibgeschwindigkeit ist hoch, da die Daten- und Paritätsblöcke auf alle Festplatten geschrieben werden können, aber der Lesezugriff ist aufgrund der Verzögerung, die durch den Sprung von zwei Paritätsreihen entsteht, langsam.
 
RAID 0+1 and 1+0
Um die Leistung und/oder zusätzliche Redundanz zu erhöhen, können die Standard-RAID-Levels kombiniert werden, um hybride oder verschachtelte RAID-Levels zu erstellen.

Der Vorteil ist, dass bei einem Ausfall einer Festplatte in einem der Level 0-Arrays die fehlenden Daten von dem anderen Array übertragen werden können. Das Hinzufügen einer zusätzlichen Festplatte zu einem Stripe erfordert jedoch das Hinzufügen einer zusätzlichen Festplatte zu den anderen Stripes, um den Speicherbedarf zwischen den Arrays auszugleichen.

Ein Nachteil dieser Konfiguration ist, dass sie sich nicht von zwei gleichzeitigen Festplattenausfällen erholen kann, es sei denn, die Festplatten befinden sich im selben Datenstripe. Im Diagramm: Wenn die Laufwerke 1 und 5 ausfallen, kann das RAID wiederhergestellt werden, aber wenn 1 und 4 ausfallen, führt dies zu einem Datenverlust.Um die Leistung und/oder zusätzliche Redundanz zu erhöhen, können die Standard-RAID-Levels kombiniert werden, um hybride oder verschachtelte RAID-Levels zu erstellen.

Der Vorteil ist, dass bei einem Ausfall einer Festplatte in einem der Level 0-Arrays die fehlenden Daten von dem anderen Array übertragen werden können. Das Hinzufügen einer zusätzlichen Festplatte zu einem Stripe erfordert jedoch das Hinzufügen einer zusätzlichen Festplatte zu den anderen Stripes, um den Speicherbedarf zwischen den Arrays auszugleichen.

Ein Nachteil dieser Konfiguration ist, dass sie sich nicht von zwei gleichzeitigen Festplattenausfällen erholen kann, es sei denn, die Festplatten befinden sich im selben Datenstripe. Im Diagramm: Wenn die Laufwerke 1 und 5 ausfallen, kann das RAID wiederhergestellt werden, aber wenn 1 und 4 ausfallen, führt dies zu einem Datenverlust.
 
RAID 10
RAID 10 ist so konfiguriert, dass das RAID 0 auf zwei RAID 1-Arrays aufgeteilt ist.

Ein großer Vorteil von RAID 10 ist, dass bis auf ein Laufwerk in jedem RAID 1-Array alle Laufwerke ohne Datenverlust ausfallen können. Wenn jedoch das ausgefallene Laufwerk nicht ersetzt wird, wird das einzige funktionierende Laufwerk in diesem Array zu einem Single Point of Failure für das gesamte System.

Die RAID-Schachteltechnik kann auch für andere RAID-Levels verwendet werden, am häufigsten für RAID 5, aber sie kann auch auf andere Levels wie 3 und 6 angewandt werden und führt zu Levels wie 50, 51, 60, 61, 30 und 03.
 

RAID 50

 

RAID 50, auch RAID 5+0 genannt, kombiniert das direkte Block-Level-Striping von RAID 0 mit der verteilten Parität von RAID 5. Wie ein RAID 0-Array, das über RAID 5-Elemente gestriped ist, erfordert die minimale RAID 50-Konfiguration sechs Laufwerke. Ein Laufwerk aus jedem der RAID 5-Sets kann ohne Datenverlust ausfallen; eine RAID 50-Konfiguration mit drei RAID 5-Sets kann beispielsweise maximal drei potenzielle gleichzeitige Laufwerksausfälle verkraften (aber nur einen pro RAID 5-Set). Da die Zuverlässigkeit des Systems davon abhängt, dass das defekte Laufwerk schnell ersetzt wird, damit das Array wiederhergestellt werden kann, ist es üblich, Hot Spares einzubauen, die bei einem Ausfall sofort mit dem Wiederaufbau des Arrays beginnen können. 

 

RAID 51

 

RAID 50, auch RAID 5+0 genannt, kombiniert das direkte Block-Level-Striping von RAID 0 mit der verteilten Parität von RAID 5. Wie ein RAID 0-Array, das über RAID 5-Elemente gestriped ist, erfordert die minimale RAID 50-Konfiguration sechs Laufwerke. Ein Laufwerk aus jedem der RAID 5-Sets kann ohne Datenverlust ausfallen; eine RAID 50-Konfiguration mit drei RAID 5-Sets kann beispielsweise maximal drei potenzielle gleichzeitige Laufwerksausfälle verkraften (aber nur einen pro RAID 5-Set). Da die Zuverlässigkeit des Systems davon abhängt, dass das defekte Laufwerk schnell ersetzt wird, damit das Array wiederhergestellt werden kann, ist es üblich, Hot Spares einzubauen, die bei einem Ausfall sofort mit dem Wiederaufbau des Arrays beginnen können. 

 

 

 

 

 

Häufig verwendetes RAID-Vokabular

RAID: RAID ist eine Technologie, die die Verwendung von 2 oder mehr Festplatten in verschiedenen Konfigurationen unterstützt, um durch die Konsolidierung von Festplattenressourcen und Paritätsberechnungen eine höhere Leistung, Zuverlässigkeit und größere Volumen zu erreichen.

Parität:  Eine mathematische Berechnung, die es ermöglicht, dass Laufwerke innerhalb eines RAID-Verbunds ausfallen können, ohne dass Daten verloren gehen. Am einfachsten lässt sich dies mit der Gleichung darstellen: A + B = C. Sie können einen beliebigen Buchstaben aus der obigen Gleichung entfernen und seinen Wert aus den verbleibenden 2 Buchstaben errechnen. Wenn z. B. B entfernt wurde, so dass die Gleichung wie A + ? = C aussieht, kann der Wert von B durch Verschieben von A ermittelt werden, so dass B = C - A ist. Dies ist natürlich eine vereinfachte Beschreibung, für ein vollständiges Verständnis im Sinne von RAID sind Kenntnisse des Binärsystems und des logischen XOR-Ausdrucks erforderlich.

Spiegeln: Die Daten von einer oder mehreren Festplatten werden auf einer oder mehreren anderen physischen Festplatten dupliziert.

Striping: Die Methode, mit der Daten und Parität über mehrere Festplatten geschrieben werden können. Die Daten werden in sequentieller Reihenfolge über die Laufwerke geschrieben, bis zum letzten Laufwerk, dann wird zum ersten zurückgesprungen und ein zweiter Stripe begonnen.

Block: Ein Block ist der logische Speicherplatz auf jeder Festplatte, in den die Daten geschrieben werden. Die Größe des Speicherplatzes wird vom RAID-Controller festgelegt und beträgt in der Regel 16 KB bis 256 KB. Die Daten füllen den Speicherplatz, bis das Limit erreicht ist, und wandern dann auf das nächste Laufwerk, bis zum letzten Laufwerk, wo sie zum Anfang des nächsten Stripes springen.

Links/Rechts-Symmetrie: Die Symmetrie in einem RAID steuert, wie die Daten und die Parität auf die Laufwerke verteilt werden. Es gibt vier Hauptarten der Symmetrie, welche davon verwendet wird, hängt vom RAID-Anbieter ab. Einige Unternehmen stellen auch eigene Modelle her, die von ihren Geschäftsanforderungen abhängen.

Hot Spare: Es gibt verschiedene Methoden für den Umgang mit Laufwerksausfällen innerhalb eines RAID, eine davon ist die Verwendung eines Hot Spare. Dabei handelt es sich um eine Ersatzplatte, die anstelle der ausgefallenen Platte verwendet werden kann.

Degradierter Modus: Wenn ein Laufwerk im RAID unlesbar wird, gilt es als defekt und wird aus dem RAID herausgenommen. Die neuen Daten und die Parität werden dann auf die verbleibenden Laufwerke innerhalb des RAID geschrieben, und wenn Daten von dem ausgefallenen Laufwerk angefordert werden, werden diese mit der Parität auf den anderen Laufwerken verrechnet. Dies verschlechtert die Leistung des RAID, daher auch der Degraded Mode.

Abonnieren

KLDiscovery Ontrack (Switzerland) GmbH, Hertistrasse 25, 8304 Wallisellen, Schweiz (Alle standorte anzeigen)