Baggrundsinformation om RAID

Written By: Ontrack

Date Published: 4. august 2023 07:33:55 EDT

Baggrundsinformation om RAID

Hvad er RAID?

Redundant Array af Independent(oprindeligt "Inexpensive") diske (RAID)-lagring har revolutioneret virksomhedens datalagringsteknologi og indbygget sikkerheden ved redundans (fra RAID 1 og højere), der i høj grad kan minimere nedetid på grund af individuelle diskfejl.

Desværre er RAID-lagring ikke en perfekt teknologi, og som følge heraf kan datatab stadig forekomme.

Definitionen af ​​RAID er i navnet på selve systemet. Stående for Redundant Array of Independent Disks betyder RAID bogstaveligt talt redundant bundling af uafhængige diske – en klynge af flere harddiske til at danne en enkelt logisk partition. Afhængigt af formålet øger RAID ydeevnen for at få adgang til og skrive data, samtidig med at sikkerheden for informationen forbedres.

RAID er en teknologi, der understøtter brugen af ​​2 eller flere harddiske i forskellige konfigurationer med det formål at opnå større ydeevne, pålidelighed og større volumenstørrelser gennem brug af diskressourcekonsolidering og paritetsberegninger.

En række standardkonfigurationer, kaldet niveauer, blev designet. Fem RAID-niveauer blev oprindeligt oprettet, men mange flere variationer har udviklet sig, især flere indlejrede niveauer og mange ikke-standardiserede (for det meste proprietære) niveauer.

Så hvad betyder RAID-niveauerne? Tallene henviser blot til konfigurationen af ​​RAID. Velvidende, at alle RAID-systemer gemmer data effektivt, vil valget af system være baseret på dine egne personlige behov. For eksempel opfylder RAID 1 behovene for ydeevne og pålidelighed. RAID 5 er et godt valg, hvis du leder efter både ydeevne og fejltolerance.

 
what-is-raid

RAID-systemoversigt

RAID er en betegnelse, der bruges til datalagringssystemer, der spreder og/eller replikerer data mellem flere harddiske. RAID blev designet med to hovedmål: at øge datapålidelighed og øge I/O (input/output) ydeevne.

Et RAID kombinerer fysiske harddiske til en enkelt logisk enhed ved hjælp af enten speciel hardware eller software. Hardware RAID-løsninger kan komme i en række forskellige stilarter, fra indbygget på bundkortet eller tilføjelseskort, op til store virksomheds NAS- eller SAN-servere. Med disse opsætninger er operativsystemet uvidende om den tekniske funktion eller RAID. Softwareløsninger implementeres normalt i operativsystemet.

Der er tre nøglebegreber i RAID:

  • spejling, kopiering af data til mere end én disk
  • striping, opdeling af data på mere end én disk
  • fejlkorrektion, hvor redundante data gemmes for at tillade problemer at blive opdaget og muligvis rettet (kendt som fejltolerance)

Forskellige RAID-niveauer bruger en eller flere af disse teknikker, afhængigt af systemkravene.

RAID bruges traditionelt på servere, men kan også bruges på arbejdsstationer. Sidstnævnte gælder især i lagringsintensive computere som dem, der bruges til video- og lydredigering.

 
 
raid-recovery-tips

RAID systemhistorik

RAID er forkortelsen for Redundant Array of Inexpensive Disks (Redundant Array of Independent Disks). Konceptet blev født på University of California, Berkeley, hvor David A. Patterson, Garth Gibson og Randy H. Katz samarbejdede om at producere operationelle prototyper af fem-niveau RAID-lagringssystemer. Resultaterne af deres forskning har dannet grundlaget for de komplekse RAID-lagringssystemer, der findes i dag. I dag ejer IBM de intellektuelle ejendomsrettigheder til RAID 5.

Designet af RAID-lagringssystemet var rettet mod at forbedre ydeevnen, gendannelsen, pålideligheden og skalerbarheden af ​​storage. Resultatet var et unikt redundanskoncept, der tilbyder muligheder for datagendannelse i tilfælde af en diskfejl i systemet. Faktisk har RAID-controllerkort fået mulighed for at fortsætte med at læse og skrive data, selvom en disk er "offline".

 

De forskellige RAID-typer

Ontrack tilbyder datarekonstruktionstjenester til alle større RAID-arkitekturer. Dette inkluderer RAID-niveauerne 0, 00, 1, 10, 1E, 1E0, 2, 3, 4, 5, 50, 5E, 5EE, 6 og 60. Vi rekonstruerer også fra et stort antal proprietære RAID-arrays.

Den løbende udvikling af vores softwareværktøjer sikrer, at vi bruger de nyeste moderne og proprietære teknikker for at opnå den bedst mulige datarekonstruktion. Derudover hjælper vores forsknings- og udviklingsteam vores ingeniører med datagendannelse, når de konfronteres med usædvanlige proprietære RAID-arrays, gennem brugerdefinerede værktøjer skabt specielt til lejligheden.

Vi anbefales af de fleste RAID-udbydere såsom HP, Dell, Adaptec, IBM, Intel, Promise, EMC, NetApp og LSI Logic.

RAID-konfiguration, inklusive antallet af brugte diske, bestemmer typen. Som en påmindelse står RAID for Redundant Array of Independent Disks og er en lagringsløsning, der distribuerer data på tværs af flere små diske, der tilsammen udgør et enkelt system. Ud over at være billigere har denne enhed et højt niveau af ydeevne og datasikkerhed, da RAID tolererer nedbrud bedre.

I dag er der næsten tyve typer RAID, hvis ikke flere, inklusive konfigurationer, der nogle gange anses for at være forældede - blandt dem er RAID 2. Af alle disse RAID-konfigurationer er de mest almindelige RAID 0, RAID 1, RAID 10, RAID 5 eller RAID 6.

RAID 0 bruger to eller flere diske og giver hurtig adgang til data, men ingen redundans. RAID 1 bruger også to diske, men skriver dublerede oplysninger til hvert drev. Hvis en af ​​diskene er beskadiget, vil du finde dine data på den anden. For at drage fordel af ydeevnen af ​​RAID 0 og den sikkerhed, som RAID 1 tilbyder, blev RAID 5 oprettet. Med en god fordeling af data kombinerer RAID 5 hastighed og fejltolerance. RAID 6 har de samme fordele som RAID 5, men med den ekstra bonus at tolerere to drevfejl i stedet for én.

 

RAID 0
RAID 0 er den klassiske konfiguration til datastriping, hvor data skrives på tværs af alle drev, hvilket giver hurtigere adgang. Denne ydeevne kommer dog med en risiko, hvis en eller flere diske forårsager en katastrofe i en RAID 0, kan der opstå alvorligt datatab.
 
Et eksempel på en datarekonstruktionssituation: en fil blev oprettet, der optager datastrimlerne 1 – 4, hvis drev 2 skulle fejle, og den anden strimmel går tabt, vil filen højst sandsynligt blive ødelagt. En anden måde at se det på ville være, hvis en disk fejler, den størst mulige gode fil skal være mindre end den samlede størrelse af de resterende striber.

RAID 1
Dette er RAID-niveauet, der opsætter diskspejling; dataene på den primære disk duplikeres til den anden. Der er ingen ydelsesforbedringer for denne type RAID, men hvis den ene disk fejler, har du en sikkerhedskopi på den anden.
 
RAID 2

RAID 2 består af bit-niveau data striping med en dedikeret paritetsenhed. Dette niveau bruger hamming-fejldetektionskoder og er beregnet til brug på enheder, der ikke har indbygget fejldetektion. Af denne grund bruges RAID 2 ikke længere.

 

RAID 3 and 4

RAID 3 og 4 bruger begge striping med en dedikeret paritetsenhed, forskellen mellem de to er, at RAID 3 strips på byteniveau, mens RAID 4 strips på blokniveau. RAID 3 bruges sjældent i disse dage på grund af den dårlige ydeevne af striping på byteniveau, RAID 4 er bedre med striping på blokniveau, men har stadig langsommere skriveydeevne på grund af at pariteten skal opdateres ved hver skrivning.

 

RAID 5
RAID 5 anses generelt for at være det bedste kompromis mellem fejltolerance, hastighed og omkostninger. Systemet deler dataene på samme måde som en RAID 0, men fordeler også paritetsdataene på alle harddiske. Hver leverandør har sin egen specifikke måde at distribuere paritetsinformation på diske, men det vil næsten altid være en af ​​disse fire måder: venstre asymmetrisk, venstre symmetrisk, højre asymmetrisk og højre symmetrisk.
 
Paritetsretningen er let at identificere, da man kan se, at den "bevæger sig" både til højre og venstre. I asymmetrisk RAID ignorerer datastriberne paritet, de springer den over, indtil de når den næste ledige plads. Symmetrisk RAID håndterer datastriber på en lidt mere kompleks måde, når dataene støder på en paritetsblok, bevæger de sig sidelæns og ned til næste sæt af striber.
 
RAID 6
RAID 6-systemet er en udvidelse af RAID 5: det udfører den samme datadistribution og vedtager en lignende opdeling af paritet, men genererer en ekstra datablok for hver stribe. På denne måde, selvom to diske skulle fejle på samme tid, ville RAID ikke lide noget datatab. I mindre RAID'er reduceres muligheden for, at to harddiske fejler på samme tid, men efterhånden som størrelsen af ​​RAID-arrayet øges, øges chancen for fejl.
 
Med hensyn til ydeevne ligner de meget RAID 5: skrivehastigheden er høj, fordi data- og paritetsblokkene kan skrives på alle diske, men læseadgangen er langsom på grund af forsinkelsen genereret af springet af to paritetsserier.
 
RAID 0+1 and 1+0
For at opnå ydeevne og/eller yderligere redundans kan standard RAID-niveauerne kombineres for at skabe hybride eller indlejrede RAID-niveauer, RAID-typer, der giver redundans, kombineres normalt med RAID 0 for at øge ydeevnen.

Fordelen er, at når en disk fejler i et af niveau 0-arrayerne, kan de manglende data overføres fra det andet array. Men tilføjelse af en ekstra harddisk til en stribe kræver tilføjelse af en ekstra harddisk til de andre striber for at balancere lagerplads mellem arrays.

En ulempe ved denne konfiguration er, at den ikke kan genoprette efter to samtidige diskfejl, medmindre diskene er fra samme datastribe.
 
RAID 10
 RAID 10 er konfigureret, så RAID 0 er opdelt på tværs af to RAID 1-arrays.


En stor fordel ved RAID 10 er, at alle på nær én disk fra hvert RAID 1-array kan fejle uden tab af data. Men hvis den fejlbehæftede disk ikke udskiftes, bliver den enkelte arbejdsenhed i det array et enkelt fejlpunkt for hele systemet. Hvis den sidste enhed fejler, går alle data i arrayet tabt.


RAID-nesting-teknikken kan også bruges til andre RAID-niveauer, mest almindeligt på RAID 5, men den kan også bruges på andre niveauer såsom 3 og 6, og derved producere niveauer som 50, 51, 60, 61, 30 og 03.
 
RAID 50 RAID 50, også kaldet RAID 5+0, kombinerer straight striping på blokniveau af RAID 0 med den distribuerede paritet af RAID 5. Som et RAID 0-array striped over RAID 5-elementer kræver minimum RAID 50-konfigurationen seks diske. Én disk fra hvert af RAID 5-sættene kan fejle uden tab af data; for eksempel kan en RAID 50-konfiguration, der omfatter tre RAID 5-sæt, tolerere maksimalt tre potentielle enhedsfejl samtidigt (men kun én pr. RAID 5-sæt). Fordi systemets pålidelighed afhænger af den hurtige udskiftning af den dårlige enhed, så arrayet kan genopbygges, er det almindeligt at inkludere "hot spares", der straks kan begynde at genopbygge arrayet i tilfælde af fejl.

RAID 51 RAID 51 implementeres ved å speile eller implementere RAID 1 på en hel RAID 5-matrise i tillegg til paritetsinformasjonen. Det lages vanligvis ved hjelp av programvare- og maskinvarebaserte RAID-teknikker der RAID 1-basert speiling er implementert gjennom et operativsystem på den maskinvarebaserte RAID 5-matrisen. RAID 51 er spesielt utviklet for forbedret sikkerhetskopiering og høye feiltoleranse. RAID 51 betraktes som et paritetssett med speildisker, og derfor følges RAID 5 av RAID 1. Den kan forbli operativ eller beskytte mot tap av data selv etter å ha mistet fire av de seks minimumskonfigurerte diskene.

 

 

 

Almindelig brugt RAID-ordforråd

RAID: RAID er en teknologi, der understøtter brugen af ​​2 eller flere harddiske i forskellige konfigurationer med det formål at opnå større ydeevne, pålidelighed og større volumenstørrelser gennem brug af diskressourcekonsolidering og paritetsberegninger.

Paritet: En matematisk beregning, der tillader enhederne i et RAID-array at fejle uden tab af data. Den nemmeste måde at vise dette på er ligningen: A + B = C. Du kan fjerne et hvilket som helst af bogstaverne fra oven og beregne værdien af ​​de 2 resterende. Det er hvis B blev fjernet, så ligningen så ud som A + ? = C, så kan B's værdi beregnes ved at flytte A, så B = C – A. Dette er naturligvis en forenklet måde at beskrive det på, for fuldt ud at forstå det i RAID forstand, kendskab til binær og den logiske XOR udtrykket er nødvendigt.

Spejling: Dataene fra 1 eller flere harddiske duplikeres til en anden fysisk(e) disk(er).

Striping: Metoden, hvor data og paritet kan skrives på tværs af flere diske. Dataene skrives på tværs af diskene i sekventiel rækkefølge indtil den sidste disk, den hopper derefter tilbage til den første og starter en anden strimmel.

Blok: En blok er den logiske plads på hver disk, hvor dataene skrives, mængden af ​​plads indstilles af RAID-controlleren og vil oftest være 16KB til 256KB i størrelse. Dataene vil fylde pladsen op, indtil grænsen er nået og derefter gå videre til næste drev, til det sidste drev, når det hopper til starten af ​​næste stribe.

Venstre / Højre symmetri: Symmetrien i et RAID styrer, hvordan data og paritet fordeles på enhederne. Der er fire hovedstile af symmetri, hvilken der bruges afhænger af RAID-leverandøren. Nogle virksomheder skaber også proprietære stilarter afhængigt af deres forretningsbehov.

Hot Spare: Der er et par forskellige metoder til at håndtere enhedsfejl i en RAID, den ene er brugen af ​​en Hot Spare. Det er en reservedisk, der kan bruges i stedet for den, der har fejlet.

Forringet tilstand: Dette sker, når en enhed i RAID'et bliver ulæselig, enheden betragtes derefter som dårlig og fjernes fra RAID'et. De nye data og paritet skrives derefter til de resterende enheder i RAID'et, hvis der anmodes om data fra den fejlbehæftede disk, forberedes de med pariteten på de andre. Dette forringer ydeevnen af ​​RAID og dermed forringet tilstand.

Tilmeld Nyhedsbrev

Ibas Ontrack ApS, C/O Regus, Christians Brygge 28, 1559 København V., Danmark (se alle lokationer)