Achtergrondinformatie over RAID

Written By: Ontrack

Date Published: 9 augustus 2023 4:36:25 EDT

Achtergrondinformatie over RAID

Wat is RAID?

Redundant Array of Independent (oorspronkelijk goedkope) Disks (RAID) opslag heeft een revolutie teweeggebracht in de technologie voor gegevensopslag in ondernemingen, door de gemoedsrust van redundantie in te bouwen (vanaf RAID 1 & hoger), wat de uitvaltijd ten gevolge van individuele schijfdefecten sterk kan minimaliseren.

Helaas is RAID-opslag geen perfecte technologie, waardoor gegevensverlies nog steeds kan optreden.

De definitie van RAID zit in de naam van het systeem zelf. RAID staat voor Redundant Array of Independent Disks en betekent letterlijk redundante bundeling van onafhankelijke schijven - een cluster van meerdere harde schijven om een enkele logische partitie te krijgen. Afhankelijk van het doel verhoogt RAID de prestaties van de toegang tot en het schrijven van gegevens, terwijl de beveiliging van de informatie wordt verbeterd.

RAID is een technologie die het gebruik van 2 of meer harde schijven in verschillende configuraties ondersteunt met het oog op het bereiken van betere prestaties, betrouwbaarheid en grotere volumegroottes door het gebruik van consolidatie van schijfbronnen en pariteitsberekeningen.

Er werden een aantal standaardconfiguraties ontworpen die niveaus worden genoemd. Oorspronkelijk waren er vijf RAID-niveaus, maar er zijn veel meer variaties ontstaan, met name verschillende geneste niveaus en vele niet-standaardniveaus (meestal eigen niveaus).

Dus, wat betekenen de RAID-niveaus? De nummers verwijzen eenvoudigweg naar de configuratie van de RAID. Wetende dat alle RAID-systemen gegevens efficiënt opslaan, zal de keuze van het systeem gebaseerd zijn op uw eigen persoonlijke behoeften. De RAID 1 bijvoorbeeld beantwoordt aan de behoeften inzake prestaties en betrouwbaarheid. De RAID 5 is een goede keuze als u zowel prestaties als fouttolerantie zoekt.

 
what-is-raid

Overzicht RAID-systeem

 

RAID is een term die wordt gebruikt voor computergegevensopslagsystemen die gegevens verdelen en/of repliceren over meerdere harde schijven. RAID werd ontworpen met twee belangrijke doelstellingen: de betrouwbaarheid van de gegevens verhogen en de I/O-prestaties (input/output) verbeteren.

Een RAID combineert fysieke harde schijven tot een enkele logische eenheid door gebruik te maken van speciale hardware of software. Hardware RAID oplossingen zijn er in verschillende stijlen, van ingebouwd op het moederbord of add in kaarten, tot grote NAS of SAN servers. Bij deze setups is het besturingssysteem niet op de hoogte van de technische werking van de RAID. Softwareoplossingen worden meestal geïmplementeerd in het besturingssysteem.

Er zijn drie sleutelconcepten in RAID:

  • mirroring, het kopiëren van gegevens naar meer dan één schijf
  • striping, het verdelen van gegevens over meer dan één schijf
  • foutcorrectie, waarbij redundante gegevens worden opgeslagen zodat problemen kunnen worden opgespoord en eventueel verholpen (bekend als fouttolerantie)

Verschillende RAID-niveaus maken gebruik van één of meer van deze technieken, afhankelijk van de systeemvereisten.

RAID wordt traditioneel gebruikt op servers, maar kan ook worden gebruikt op werkstations. Dit laatste is vooral het geval bij computers met veel opslagruimte, zoals die voor video- en audiobewerking worden gebruikt.

 
 
raid-recovery-tips

RAID-systeemgeschiedenis

RAID is het acroniem voor Redundant Array of Inexpensive Disks (Redundante Reeks van Onafhankelijke Schijven). Het concept is ontstaan aan de Universiteit van Californië, Berkeley, waar David A. Patterson, Garth Gibson en Randy H. Katz samenwerkten aan de productie van operationele prototypes van vijf niveaus van RAID-opslagsystemen. Het resultaat van hun onderzoek vormde de basis van de complexe RAID-opslagsystemen die vandaag bestaan. Vandaag bezit IBM de intellectuele eigendomsrechten op RAID 5.

Het ontwerp van het RAID-opslagsysteem was gericht op het verbeteren van de prestaties, het herstel, de betrouwbaarheid en de schaalbaarheid van opslag. Het resultaat was een uniek redundantieconcept dat mogelijkheden biedt voor gegevensherstel wanneer een schijf in het systeem defect raakt. In feite hebben RAID-controllerkaarten de mogelijkheid gekregen om door te gaan met het lezen en schrijven van gegevens, zelfs als een schijf "offline" is.

 

De verschillende soorten RAID

Ontrack biedt data recovery diensten aan voor alle belangrijke RAID architecturen. Dit omvat onder andere, RAID-niveaus 0, 00, 1, 10, 1E, 1E0, 2, 3, 4, 5, 50, 5E, 5EE, 6 en 60. Wij werken ook voor een groot aantal merkgebonden RAID arrays.

De voortdurende ontwikkeling van onze software tools zorgt ervoor dat we gebruik maken van de laatste state-of-the-art en proprietary technieken om de best mogelijke data recovery te bereiken. Bovendien helpt het onderzoeks- en ontwikkelingsteam onze technici bij gegevensherstel wanneer zij worden geconfronteerd met ongebruikelijke proprietary RAID arrays, door middel van aangepaste tools die speciaal voor deze gelegenheid zijn gemaakt.

Wij worden aanbevolen door de meeste RAID-leveranciers, zoals HP, Compaq, Dell, Adaptec, IBM, Intel, Promise, LSI Logic, Mylex, Xiotech en Netsan. Allen hebben hun eigen RAID configuratie, een specifieke data blok grootte, en een pariteit grootte en unieke symmetrie.

Onze RAID herstel mogelijkheden stoppen niet alleen bij NTFS, onze vaardigheden strekken zich ook uit tot MAC, UNIX, FAT en VMware RAIDs.

De RAID-configuratie, met inbegrip van het aantal gebruikte schijven, bepaalt het type. Ter herinnering: RAID, dat staat voor Redundant Array of Independent Disks of Redundant Independent Disk Array, is een opslagoplossing die gegevens verdeelt over meerdere kleine schijven die samen één systeem vormen. Deze voorziening is niet alleen goedkoper, maar biedt ook een hoog prestatieniveau en een hoge mate van gegevensbeveiliging, aangezien RAID storingen beter verdraagt.

Vandaag zijn er bijna twintig soorten RAID, zo niet meer, met inbegrip van configuraties die soms als verouderd worden beschouwd, waaronder RAID 2. Van al deze RAID-configuraties zijn de meest voorkomende RAID 0, RAID 1, RAID 10, RAID 2, RAID 3 en 4, RAID 5 of RAID 6.

 

RAID 0
RAID 0 is de klassieke configuratie voor het strippen van gegevens, waarbij gegevens over alle schijven worden geschreven, wat resulteert in snellere toegang. Deze prestatie houdt echter een risico in, als één of meer schijven een ramp veroorzaken in een RAID 0, dan kan er een ernstig verlies van gegevens optreden. Het diagram hieronder toont hoe de gegevens worden verdeeld over de matrix.

Een voorbeeld van een situatie van gegevensherstel: een bestand werd aangemaakt dat gegevensstroken 1 - 4 bezet, als schijf 2 zou uitvallen en de 2e strook verloren zou gaan, zou het bestand hoogstwaarschijnlijk beschadigd raken. Een andere manier om het te bekijken zou zijn dat als één schijf uitvalt, het grootst mogelijke goede bestand kleiner zou moeten zijn dan de gecombineerde grootte van de resterende strepen.
 
RAID 1
Dit is het RAID niveau dat spiegeling van schijven instelt; de gegevens op de primaire schijf worden gedupliceerd op de andere schijf. Deze RAID levert geen prestatiewinst op, maar als één schijf uitvalt, is er een back-up op de tweede schijf.
 

RAID 2

 

RAID 2 bestaat uit gegevensstriping op bitniveau met een specifieke pariteitsschijf. Dit niveau maakt gebruik van hamming-foutdetectiecodes en is bedoeld voor gebruik op schijven die geen ingebouwde foutdetectie hebben. Om deze reden wordt RAID 2 niet meer algemeen gebruikt

 

RAID 3 and 4

 

RAID 3 en 4 gebruiken beide striping met een speciale pariteitsschijf, het verschil tussen de twee is dat RAID 3 op byte-niveau stript terwijl RAID 4 op blokniveau stript. RAID 3 wordt tegenwoordig zelden gebruikt vanwege de slechte prestaties van striping op byte-niveau, RAID 4 is beter met striping op blokniveau maar heeft nog steeds langzamere schrijfprestaties vanwege de pariteit die bij elke schrijf moet worden bijgewerkt.

 

RAID 5
RAID 5 wordt algemeen beschouwd als het beste compromis tussen fouttolerantie, snelheid en kosten. Het systeem verdeelt de gegevens op dezelfde manier als een RAID 0, maar verdeelt ook de pariteitsgegevens over alle harde schijven waaruit het is opgebouwd. Elke leverancier heeft zijn eigen specifieke manier om de pariteitsinformatie over de schijven te verdelen, maar het zal bijna altijd één van deze vier manieren zijn: links asymmetrisch, links symmetrisch, rechts asymmetrisch en rechts symmetrisch.

De richting van de pariteit is eenvoudig te identificeren, zoals u kunt zien "beweegt" het zowel naar rechts als naar links. In asymmetrische RAID's negeren de gegevensstroken de pariteit, ze slaan het over tot ze de volgende beschikbare ruimte bereiken. Symmetrische RAID's behandelen data strips op een iets complexere manier, zodra de data een pariteit blok tegenkomt, bewegen ze zijwaarts en naar beneden naar de volgende stripe set.
 
RAID 6
Het RAID 6-systeem is een uitbreiding van RAID 5: het voert dezelfde gegevensverdeling uit en gebruikt een soortgelijke verdeling van de pariteit, maar genereert een extra gegevensblok voor elke strip. Op die manier zal de RAID, zelfs indien twee schijven tegelijk zouden uitvallen, geen gegevensverlies lijden. In kleinere RAID's is de kans dat twee harde schijven tegelijk uitvallen kleiner, maar naarmate de omvang van de RAID-array toeneemt, neemt de kans op storingen toe.

De prestaties lijken sterk op die van RAID 5: de schrijfsnelheid is hoog, omdat de gegevens- en pariteitsblokken op alle schijven kunnen worden geschreven, maar de leestoegang is traag door de vertraging die wordt gegenereerd door de sprong van twee pariteitsreeksen.
 
RAID 0+1 and 1+0
Om de prestaties en/of bijkomende redundantie te verhogen, kunnen de standaard RAID-niveaus worden gecombineerd om hybride of geneste RAID-niveaus te creëren, RAID-types die redundantie bieden worden meestal gecombineerd met RAID 0 om de prestaties te verhogen. Zoals u in de onderstaande diagrammen kunt zien, zijn deze twee RAID-niveaus een combinatie van RAID 0 en RAID 1. Het verschil tussen de twee is de eigenlijke positie van de RAID array, getoond door de diagrammen waar de banden vetgedrukt zijn. RAID 01 is zo geconfigureerd dat RAID 0 een spiegelkopie is. Het voordeel is dat wanneer een schijf uitvalt in een van de level 0 arrays, de ontbrekende gegevens kunnen worden overgezet vanuit de andere array. Als u echter een extra harde schijf toevoegt aan één strip, moet u een extra harde schijf toevoegen aan de andere stroken om de opslagruimte tussen de arrays in evenwicht te brengen. Een nadeel van deze configuratie is dat het niet mogelijk is om te herstellen van twee gelijktijdige schijfstoringen, tenzij de schijven van dezelfde datastrip zijn.
 

RAID 10

 

RAID 10 is zo geconfigureerd dat de RAID 0 verdeeld is over twee RAID 1 arrays. Een groot voordeel van RAID 10 is dat alle schijven van elke RAID 1 array, op één na, kunnen uitvallen zonder gegevensverlies. Als de defecte schijf echter niet wordt vervangen, wordt de enige werkende schijf in die array een single point of failure voor het hele systeem, als die laatste schijf defect gaat, gaan alle gegevens in de array verloren. De RAID nesting techniek kan ook gebruikt worden voor andere RAID niveaus, meestal op RAID 5 maar het kan ook toegepast worden op andere niveaus zoals 3 en 6, waardoor niveaus zoals 50, 51, 60, 61, 30 en 03 ontstaan.
 

RAID 50

 

RRAID 50, ook wel RAID 5+0 genoemd, combineert de rechte block-level striping van RAID 0 met de gedistribueerde pariteit van RAID 5. Als een RAID 0 array gestriped over RAID 5 elementen, vereist een minimale RAID 50 configuratie zes schijven. Rechts ziet u een voorbeeld waarbij drie verzamelingen RAID 5's van 120 GB worden samengevoegd tot een totale opslagruimte van 720 GB. Eén schijf van elk van de RAID 5-reeksen kan defect gaan zonder gegevensverlies; een RAID 50-configuratie met drie RAID 5-reeksen kan bijvoorbeeld maximaal drie potentiële gelijktijdige schijfdefecten verdragen (maar slechts één per RAID 5-reeks). Omdat de betrouwbaarheid van het systeem afhangt van een snelle vervanging van de slechte schijf zodat de array opnieuw kan worden opgebouwd, is het gebruikelijk om hot spares op te nemen die onmiddellijk kunnen beginnen met de heropbouw van de array na een defect

 

RAID 51

 

RAID 51 wordt geïmplementeerd door een volledige RAID 5-array te spiegelen of RAID 1 te implementeren, naast de pariteitsinformatie. RAID 51 wordt over het algemeen gecreëerd met behulp van RAID-technieken op basis van software en hardware, waarbij het spiegelen op basis van RAID 1 wordt geïmplementeerd via een besturingssysteem op de RAID 5-array op basis van hardware. RAID 51 is specifiek ontworpen voor een betere beschikbaarheid van back-ups en een hoge fouttolerantie. RAID 51 wordt beschouwd als een pariteitsset van gespiegelde schijven, vandaar dat RAID 5 wordt gevolgd door RAID 1. Hij kan operationeel blijven of bescherming bieden tegen gegevensverlies, zelfs na verlies van vier van de zes minimaal geconfigureerde schijven.

 

 

 

 

 

 

 

 

 

Veelgebruikte RAID Woorden

RAID: RAID is een technologie die het gebruik van 2 of meer harde schijven in verschillende configuraties ondersteunt met als doel het bereiken van betere prestaties, betrouwbaarheid en grotere volumegroottes door het gebruik van consolidatie van schijfbronnen en pariteitsberekeningen.

Pariteit: Een wiskundige berekening die het mogelijk maakt dat schijven binnen een RAID-array kunnen uitvallen zonder dat er gegevens verloren gaan. De eenvoudigste manier om dit weer te geven is de vergelijking: A + B = C. U kunt om het even welke van de letters van hierboven verwijderen en zijn waarde berekenen uit de 2 overblijvende. B.v. als B werd verwijderd zodat de vergelijking eruit zag als A + ? = C, dan kan de waarde van B worden berekend door de A te verplaatsen, dus B = C - A. Dit is duidelijk een simplistische manier om het te beschrijven, om het volledig te begrijpen in een RAID zin, is kennis van binair en de logische XOR uitdrukking vereist.

Mirroring : De gegevens van 1 of meer harde schijven worden gedupliceerd op een andere fysieke schijf (schijven).

Striping: De methode waarbij data en pariteit over meerdere schijven geschreven kunnen worden. In onderstaand voorbeeld worden de gegevens in een opeenvolgende volgorde over de schijven geschreven tot aan de laatste schijf, daarna springt het terug naar de eerste en begint een 2e strip.

Blok: Een blok is de logische ruimte op elke schijf waar de gegevens worden geschreven, de hoeveelheid ruimte wordt ingesteld door de RAID controller en is meestal 16KB tot 256KB groot. De gegevens vullen de ruimte op tot de limiet is bereikt en gaan dan naar de volgende schijf, tot de laatste schijf waar ze naar het begin van de volgende strip springen.

Links / Rechts Symmetrie: De symmetrie in een RAID bepaalt hoe de gegevens en pariteit worden verdeeld over de schijven. Er zijn vier hoofdstijlen van symmetrie, welke wordt gebruikt hangt af van de RAID-leverancier. Sommige bedrijven maken ook eigen stijlen, afhankelijk van hun bedrijfsbehoeften.

Hot Spare: Er zijn een paar verschillende methodes om met schijfstoringen binnen een RAID om te gaan, één daarvan is het gebruik van een Hot Spare. Dit is een reserveschijf die kan worden gebruikt in plaats van de defecte schijf.

Degraded mode: Dit gebeurt wanneer een schijf in de RAID onleesbaar wordt, de schijf wordt dan beschouwd als slecht en wordt teruggetrokken uit de RAID. De nieuwe gegevens en de pariteit worden dan geschreven naar de overblijvende schijven binnen de RAID, als gegevens worden opgevraagd van de defecte schijf, worden deze verwerkt met de pariteit op de andere schijven. Dit vermindert de prestaties van de RAID, vandaar de degraded mode.

Topics:

RAID Recovery

Abonneren

KLDiscovery Ontrack B.V., De Brand 22, 3823 LJ Amersfoort, Nederland (Bekijk alle locaties)