Bakgrunnsinformasjon om RAID

Written By: Ontrack

Date Published: august 09, 2023

Bakgrunnsinformasjon om RAID

Hva er RAID?

Redundant Array of Independent (opprinnelig "Inexpensive") Disks (RAID)-lagring har revolusjonert bedriftens datalagringsteknologi, og bygget inn tryggheten av redundans (fra RAID 1 og høyere) som i stor grad kan minimere nedetid på grunn av individuelle diskfeil.

Dessverre er RAID-lagring ikke en perfekt teknologi, og som et resultat kan tap av data fortsatt forekomme.

Definisjonen av RAID er i navnet på selve systemet. Står for Redundant Array of Independent Disks, betyr RAID bokstavelig talt redundant bunting av uavhengige disker – en klynge av flere harddisker for å få en enkelt logisk partisjon. Avhengig av formålet, øker RAID ytelsen for tilgang til og skriving av data, samtidig som sikkerheten til informasjonen forbedres.

RAID er en teknologi som støtter bruk av 2 eller flere harddisker i ulike konfigurasjoner med det formål å oppnå større ytelse, pålitelighet og større volumstørrelser gjennom bruk av konsolidering av diskressurser og paritetsberegninger.

Det ble designet en rekke standardkonfigurasjoner som omtales som nivåer. Det var opprinnelig opprettet fem RAID-nivåer, men mange flere variasjoner har utviklet seg, spesielt flere nestede nivåer og mange ikke-standardnivåer (for det meste proprietære).

Så, hva betyr RAID-nivåene? Tallene refererer ganske enkelt til konfigurasjonen av RAID. Når du vet at alle RAID-systemer lagrer data effektivt, vil valget av system være basert på dine egne personlige behov. RAID 1 oppfyller for eksempel behovene til ytelse og pålitelighet. RAID 5 er et godt valg hvis du er ute etter både ytelse og feiltoleranse.

 
what-is-raid

RAID-systemoversikt

RAID er et begrep som brukes for datalagringssystemer som sprer og/eller replikerer data mellom flere harddisker. RAID ble designet med to hovedmål: å øke datapålitelighet og økt I/O (input/output) ytelse.

Et RAID kombinerer fysiske harddisker til en enkelt logisk enhet ved å bruke enten spesiell maskinvare eller programvare. Maskinvare RAID-løsninger kan komme i en rekke stiler, fra innebygd på hovedkortet eller tilleggskort, opp til store bedrifts-NAS- eller SAN-servere. Med disse oppsettene er operativsystemet uvitende om den tekniske funksjonen eller RAID. Programvareløsninger er vanligvis implementert i operativsystemet.

Det er tre nøkkelbegreper i RAID:

  • speiling, kopiering av data til mer enn én disk
  • striping, deling av data over mer enn én disk
  • feilretting, der redundante data lagres for å tillate problemer å bli oppdaget og muligens fikset (kjent som feiltoleranse)

Ulike RAID-nivåer bruker én eller flere av disse teknikkene, avhengig av systemkravene.

RAID brukes tradisjonelt på servere, men kan også brukes på arbeidsstasjoner. Det siste gjelder spesielt i lagringsintensive datamaskiner som de som brukes til video- og lydredigering.

raid-recovery-tips

RAID-systemhistorikk

RAID er forkortelsen for Redundant Array of Inexpensive Disks (Redundant Array of Independent Disks). Konseptet ble født ved University of California, Berkeley, hvor David A. Patterson, Garth Gibson og Randy H. Katz samarbeidet om å produsere operasjonelle prototyper av fem nivåer av RAID-lagringssystemer. Resultatet av deres forskning har dannet grunnlaget for de komplekse RAID-lagringssystemene som eksisterer i dag. I dag har IBM de immaterielle rettighetene til RAID 5.

Utformingen av RAID-lagringssystemet var rettet mot å forbedre ytelsen, gjenopprettingen, påliteligheten og skalerbarheten til lagring. Resultatet var et unikt redundanskonsept som tilbyr datagjenopprettingsmuligheter i tilfelle en disk feiler i systemet. Faktisk har RAID-kontrollerkort fått muligheten til å fortsette å lese og skrive data selv om en disk er "offline".

De forskjellige RAID-typer

Ontrack tilbyr datarekonstruksjonstjenester for alle større RAID-arkitekturer. Dette inkluderer RAID-nivåene 0, 00, 1, 10, 1E, 1E0, 2, 3, 4, 5, 50, 5E, 5EE, 6 og 60. Vi rekonstruerer også fra et stort antall proprietære RAID-arrayer.

Den kontinuerlige utviklingen av programvareverktøyene våre sikrer at vi bruker de siste moderne og proprietære teknikkene for å oppnå best mulig datagjenoppretting. I tillegg bistår forsknings- og utviklingsteamet våre ingeniører med datagjenoppretting når de blir konfrontert med uvanlige proprietære RAID-arrayer, gjennom tilpassede verktøy laget spesielt for anledningen.

Vi anbefales av de fleste RAID-leverandører som HP, Dell, Adaptec, IBM, Intel, Promise, EMC, NetApp og LSI Logic.

RAID-konfigurasjon, inkludert antall disker som brukes, bestemmer typen. Som en påminnelse står RAID for Redundant Array of Independent Disks og er en lagringsløsning som distribuerer data på tvers av flere små disker som til sammen utgjør et enkelt system. I tillegg til å være rimeligere, har denne enheten et høyt nivå av ytelse og datasikkerhet ettersom RAID tolererer sammenbrudd bedre.

I dag er det nesten tjue typer RAID, om ikke flere, inkludert konfigurasjoner som noen ganger anses for å være foreldet - blant dem er RAID 2. Av alle disse RAID-konfigurasjonene er de vanligste RAID 0, RAID 1, RAID 10, RAID 5 eller RAID 6.

RAID 0 bruker to eller flere disker og gir rask tilgang til data, men ingen redundans. RAID 1 bruker også to disker, men skriver duplikatinformasjon til hver stasjon. Hvis en av diskene er skadet, vil du finne dataene dine på den andre. For å dra nytte av ytelsen til RAID 0 og sikkerheten som tilbys av RAID 1, ble RAID 5 opprettet. Med en god distribusjon av data kombinerer RAID 5 hastighet og feiltoleranse. RAID 6 har de samme fordelene som RAID 5, men med den ekstra bonusen å tolerere to stasjonsfeil i stedet for én.

 

RAID 0
RAID 0 er den klassiske konfigurasjonen for data-striping, der data skrives over alle stasjoner, noe som gir raskere tilgang. Denne ytelsen innebærer imidlertid en risiko, hvis en eller flere disker forårsaker en katastrofe i et RAID 0, kan det oppstå et alvorlig tap av data.

Et eksempel på en datarekonstruksjonsituasjon: det ble opprettet en fil som okkuperte datastriper 1 – 4, hvis stasjon 2 skulle feile og den andre stripen mistes, vil filen mest sannsynlig bli ødelagt. En annen måte å se det på ville være hvis en disk feiler, den største mulige gode filen må være mindre enn den kombinerte størrelsen på de gjenværende stripene.
RAID 1

Dette er RAID-nivået som setter opp diskspeiling; dataene på den primære disken dupliseres til den andre. Det er ingen ytelsesgevinster for denne type RAID, men hvis en disk feiler, vil du ha en sikkerhetskopi på den andre.

RAID 2

 

RAID 2 består av datastriping på bitnivå med en dedikert paritetsenhet. Dette nivået bruker hamming feildeteksjonskoder og er beregnet for bruk på enheter som ikke har innebygd feildeteksjon. Av denne grunn brukes ikke RAID 2 lenger.

 

RAID 3 and 4

 

RAID 3 og 4 bruker begge striping med en dedikert paritetsenhet, forskjellen mellom de to er at RAID 3 striper på bytenivå mens RAID 4 striper på blokknivå. RAID 3 brukes sjelden i disse dager på grunn av den dårlige ytelsen til striping på bytenivå, RAID 4 er bedre med striping på blokknivå, men har fortsatt langsommere skriveytelse på grunn av at pariteten må oppdateres ved hver skriving.

 

RAID 5
RAID 5 anses generelt for å være det beste kompromisset mellom feiltoleranse, hastighet og kostnad. Systemet deler dataene på samme måte som et RAID 0, men fordeler også paritetsdataene på alle harddiskene. Hver leverandør har sin egen spesifikke måte å distribuere paritetsinformasjon på disker, men det vil nesten alltid være en av disse fire måtene: venstre asymmetrisk, venstre symmetrisk, høyre asymmetrisk og høyre symmetrisk.

Paritetsretningen er enkel å identifisere, siden du kan se at den "beveger seg" både til høyre og venstre. I asymmetriske RAID ignorerer datastripene paritet, de hopper over den til de når neste tilgjengelige plass. Symmetriske RAID håndterer datastriper på en litt mer kompleks måte, når dataene møter en paritetsblokk, beveger de seg sidelengs og ned til neste stripesett.

RAID 6

 

RAID 6-systemet er en utvidelse av RAID 5: det utfører den samme datadistribusjonen og vedtar en lignende inndeling av paritet, men genererer en ekstra datablokk for hver stripe. På denne måten, selv om to disker skulle svikte samtidig, ville RAID-et ikke lide tap av data. I mindre RAIDs reduseres muligheten for at to harddisker svikter samtidig, men etter hvert som størrelsen på RAID-arrayet øker, øker sjansen for feil.

Når det gjelder ytelse, ligner de veldig på RAID 5: skrivehastigheten er høy, fordi data- og paritetsblokkene kan skrives på alle disker, men lesetilgangen er treg på grunn av forsinkelsen generert av hoppet med to paritets-serier.
 
RAID 0+1 and 1+0
For å oppnå ytelse og/eller ekstra redundans kan standard RAID-nivåene kombineres for å lage hybride eller nestede RAID-nivåer, RAID-typer som gir redundans kombineres vanligvis med RAID 0 for å øke ytelsen.

Fordelen er at når en disk feiler i en av nivå 0-matrisene, kan de manglende dataene overføres fra den andre matrisen. Men å legge til en ekstra harddisk til en stripe krever at du legger til en ekstra harddisk til de andre stripene for å balansere ut lagringsplass mellom arrayene.

En ulempe for denne konfigurasjonen er at den ikke kan gjenopprette fra to samtidige diskfeil, med mindre diskene er fra samme datastripe.
 
RAID 10
RAID 10 er konfigurert slik at RAID 0 er delt over to RAID 1-arrayer.

En stor fordel med RAID 10 er at alle unntatt én disk fra hver RAID 1-array kan feile uten tap av data. Men hvis den feilende disk ikke erstattes, blir den eneste arbeidsenheten i det arrayet et enkelt feilpunkt for hele systemet, hvis den siste enheten går, går alle data i arrayet tapt.

RAID-nesting-teknikken kan også brukes for andre RAID-nivåer, oftest på RAID 5, men den kan også brukes på andre nivåer som 3 og 6, og produserer derved nivåer som 50, 51, 60, 61, 30 og 03.
 

RAID 50

 

RAID 50, også kalt RAID 5+0, kombinerer den rette striping på blokknivå av RAID 0 med den distribuerte pariteten til RAID 5. Som et RAID 0-array stripet over RAID 5-elementer, krever minimal RAID 50-konfigurasjon seks disker. Én disk fra hvert av RAID 5-settene kan svikte uten tap av data; for eksempel kan en RAID 50-konfigurasjon som inkluderer tre RAID 5-sett tolerere maksimalt tre potensielle enhetsfeil samtidig (men bare én per RAID 5-sett). Fordi påliteligheten til systemet avhenger av rask utskifting av den dårlige enheten slik at matrisen kan gjenoppbygges, er det vanlig å inkludere "hot spares" som umiddelbart kan begynne å gjenoppbygge matrisen ved feil.

 

RAID 51

 

RAID 51 implementeres ved å speile eller implementere RAID 1 på en hel RAID 5-matrise i tillegg til paritetsinformasjonen. Det lages vanligvis ved hjelp av programvare- og maskinvarebaserte RAID-teknikker der RAID 1-basert speiling er implementert gjennom et operativsystem på den maskinvarebaserte RAID 5-matrisen. RAID 51 er spesielt utviklet for forbedret sikkerhetskopiering og høye feiltoleranse. RAID 51 betraktes som et paritetssett med speildisker, og derfor følges RAID 5 av RAID 1. Den kan forbli operativ eller beskytte mot tap av data selv etter å ha mistet fire av de seks minimumskonfigurerte diskene.

 

 

 

 

 

 

 

 

Vanlig brukt RAID-vokabular

RAID: RAID er en teknologi som støtter bruk av 2 eller flere harddisker i ulike konfigurasjoner med det formål å oppnå større ytelse, pålitelighet og større volumstørrelser gjennom bruk av konsolidering av diskressurser og paritetsberegninger.

Paritet: En matematisk beregning som lar enhetene i et RAID-array svikte uten tap av data. Den enkleste måten å vise dette på er ligningen: A + B = C. Du kan fjerne hvilken som helst av bokstavene ovenfra og regne ut verdien av de 2 gjenværende. Dvs. hvis B ble fjernet slik at ligningen så ut som A + ? = C, så kan Bs verdi beregnes ved å flytte A, så B = C – A. Dette er åpenbart en forenklet måte å beskrive det på, for å forstå det fullt ut i RAID-forstand, kunnskap om binær og det logiske XOR-uttrykket er nødvendig.

Speiling: Dataene fra 1 eller flere harddisker dupliseres til en annen fysisk(e) disk(er).

Striping: Metoden hvor data og paritet kan skrives over flere disker. Dataene skrives over diskene i sekvensiell rekkefølge frem til den siste disken, den hopper deretter tilbake til den første og starter en andre stripe.

Blokk: En blokk er den logiske plassen på hver disk hvor dataene skrives, hvor mye plass er satt av RAID-kontrolleren og vil oftest være 16KB til 256KB i størrelse. Dataene vil fylle opp plassen til grensen er nådd og deretter gå videre til neste stasjon, til den siste stasjonen når den hopper til starten av neste stripe.

Venstre / Høyre Symmetri: Symmetrien i et RAID kontrollerer hvordan dataene og pariteten fordeles på enhetene. Det er fire hovedstiler av symmetri, hvilken som brukes avhenger av RAID-leverandøren. Noen selskaper lager også proprietære stiler avhengig av deres forretningsbehov.

Hot Spare: Det finnes noen forskjellige metoder for å håndtere enhetsfeil i et RAID, en er bruken av en Hot Spare. Det er en reservedisk som kan brukes i stedet for den som har fejlet.

Degradert modus: Dette skjer når en enhet i RAID-et blir uleselig, enheten anses da som dårlig og trekkes ut av RAID-et. De nye dataene og pariteten blir deretter skrevet til de gjenværende enhetene i RAID-et, hvis noen data blir forespurt fra den feilede disk, blir den utarbeidet med pariteten på de andre. Dette forringer ytelsen til RAID, og ​​dermed forringet modus.

Abonner på Nyhetsbrev

Ibas Ontrack AS, Fjellgata 2, 2212 Kongsvinger, Norge (se alle lokasjoner)