Bakgrundsinformation om RAID

Written By: Ontrack

Date Published: augusti 09, 2023

Bakgrundsinformation om RAID

Vad är RAID?

Redundant Array of Independent (tidigare Inexpensive) Disks) har revolutionerat tekniken för datalagring i företag genom att den ger trygghet genom redundans (från RAID 1 och uppåt), vilket i hög grad kan minska stilleståndstiden på grund av fel på enskilda diskar.

Tyvärr är dock RAID-lagring ingen perfekt teknik och därför kan dataförluster fortfarande uppstå.

Definitionen av RAID finns i själva systemets namn. RAID står för Redundant Array of Independent Disks och betyder bokstavligen redundans mellan diskar - ett kluster av flera hårddiskar för att få en enda logisk partition. Beroende på syftet ökar RAID prestandan för åtkomst till och skrivning av data, samtidigt som driftsäkerheten förbättras.

RAID är en teknik som stöder användningen av två eller flera hårddiskar i olika konfigurationer i syfte att uppnå högre prestanda, tillförlitlighet och större volymstorlekar genom att konsolidera diskresurser och paritetsberäkningar.

Ett antal standardkonfigurationer har utformats som kallas nivåer. Ursprungligen skapades fem RAID-nivåer, men många fler varianter har utvecklats, särskilt flera inbäddade nivåer och många icke-standardiserade nivåer (mestadels proprietära).

Vad betyder RAID-nivåerna? Siffrorna hänvisar helt enkelt till RAID-konfigurationen. Eftersom alla RAID-system lagrar data på ett effektivt sätt, kommer valet av system att baseras på dina personliga behov. RAID 1 uppfyller till exempel behoven av prestanda och tillförlitlighet. RAID 5 är ett bra val om du är ute efter både prestanda och feltolerans.

Översikt över RAID-system

RAID är en term som används för datalagringssystem som sprider och/eller replikerar data mellan flera hårddiskar. RAID utformades med två huvudmål: ökad datatillförlitlighet och ökad I/O-prestanda (input/output).

En RAID kombinerar fysiska hårddiskar till en enda logisk enhet med hjälp av antingen särskild hårdvara eller programvara. Hårdvarulösningar för RAID finns i många olika utföranden, från inbyggda på moderkortet eller separata till stora företags NAS- eller SAN-servrar. Med dessa konfigurationer är operativsystemet ovetande om RAID-systemets tekniska funktion. Mjukvarulösningar implementeras vanligtvis i operativsystemet.

Det finns tre nyckelbegrepp inom RAID:

  •  Spegling, kopiering av data till mer än en disk.
  • Striping, uppdelning av data på mer än en disk.
  • Felkorrigering, där redundanta data lagras för att problem ska kunna upptäckas och eventuellt åtgärdas (så kallad feltolerans).

Olika RAID-nivåer använder en eller flera av dessa tekniker, beroende på systemkraven.

RAID används traditionellt på servrar, men kan även användas på arbetsstationer. Det sistnämnda gäller särskilt för lagringsintensiva datorer, t.ex. de som används för video- och ljudredigering.

RAID-systemets Historia

RAID är en akronym för Redundant Array of Inexpensive Disks (Redundant Array of Independent Disks). Konceptet föddes vid University of California, Berkeley, där David A. Patterson, Garth Gibson och Randy H. Katz samarbetade för att ta fram operativa prototyper av fem nivåer av RAID-lagringssystem. Resultatet av deras forskning har utgjort grunden för de komplexa RAID-lagringssystem som finns idag. I dag innehar IBM de immateriella rättigheterna till RAID 5.

Utformningen av RAID-lagringssystemet syftade till att förbättra lagringens prestanda, återställning, tillförlitlighet och skalbarhet. Resultatet blev ett unikt redundanskoncept som ger möjligheter till dataåterställning om en enhet i systemet skulle gå sönder. RAID-styrkort har faktiskt fått förmågan att fortsätta läsa och skriva data även om en disk är "offline".

De olika typerna av RAID

Ibas Ontrack erbjuder dataräddningstjänster för alla större RAID-arkitekturer. Detta inkluderar RAID-nivåerna 0, 00, 1, 10, 1E, 1E0, 2, 3, 4, 5, 50, 5E, 5EE, 6 och 60. Vi återställer även ett stort antal proprietära RAID-arrayer.

Den kontinuerliga utvecklingen av våra programvaruverktyg garanterar att vi använder de senaste moderna och egenutvecklade teknikerna för att uppnå bästa möjliga resultat. Dessutom hjälper forsknings- och utvecklingsteamet våra tekniker med dataräddningarna när de ställs inför ovanliga proprietära RAID-arrayer, genom anpassade verktygen till det specifika uppdraget.

RAID 0

RAID 0 är den allra enklaste RAID konfigurationen och den skapar inte någon extra säkerhet. Alla data som skrivs till enheten sprids ut jämnt över alla diskarna. Fördelen är att läs/och skrivhastigheten ökar när mer än en disk delar på arbetet. Det totala lagringsutrymmet blir detsamma som summan av de separata diskarnas utrymme. Inga kopior finns i systemet och om en disk kraschar går data förlorade.

Ett exempel på en dataförlust (4 hårddiskar i RAID 0): en fil skapas som och tar upp datastripe 1 - 4. Om disk nr:2 kraschar stripe två går förlorad, blir filen skadad. Ett annat sätt att se på saken är att om en disk kraschar finns det bara möjligheter att rädda filer som är mindre än de resterande stripens sammanlagda storlek.

RAID 1

Detta är den RAID-nivå som innebär att hårddiskarna speglas; data på den primära disken dupliceras på den andra disken. Det finns inga prestandavinster för denna RAID, men om en disk går sönder har du en säkerhetskopia på den andra disken.

RAID 2

RAID 2 innebär fördelning av data på bitnivå med en särskild paritetsdisk. Denna nivå använder hamming felidentifieringskoder och är avsedd att användas på enheter som inte har inbyggd felidentifiering. Av denna anledning är RAID 2 inte vanligt förekommande längre.

RAID 3 and 4

 

RAID 3 och 4 använder båda striping med en särskild paritetsenhet, men skillnaden mellan de två är att RAID 3 stripar på byte-nivå medan RAID 4 stripar på blocknivå. RAID 3 används sällan nuförtiden på grund av den dåliga prestandan för striping på byte-nivå, RAID 4 är bättre med striping på blocknivå, men har fortfarande långsammare skrivprestanda på grund av att pariteten måste uppdateras vid varje skrivning.

RAID 5

RAID 5 anses allmänt vara den bästa kompromissen mellan feltolerans, hastighet och kostnad. Systemet delar upp data på samma sätt som en RAID 0, men distribuerar även paritetsdata på alla hårddiskar som ingår i systemet. Varje leverantör har sitt eget specifika sätt att fördela paritetsinformationen på diskarna, men det kommer nästan alltid att vara något av dessa fyra sätt: left asymmetric, left symmetric, right asymmetric och right symmetric.

Paritetsriktningen är enkel att identifiera, eftersom du kan se att den "rör sig" både till höger och vänster. I asymmetriska RAID:er ignorerar datastripsen pariteten, de hoppar över den tills de når nästa tillgängliga utrymme. Symmetriska RAID:er hanterar datastripsen på ett något mer komplicerat sätt, när data stöter på ett paritetsblock flyttar de sig i sidled och ner till nästa stripeuppsättning.

RAID 6

RAID 6-systemet är en vidareutveckling av RAID 5. Det utför samma datafördelning och använder en liknande paritetsfördelning, men genererar ett extra datablock för varje stripe. Tack vare detta riskerar man inte att förlora data även om två diskar kraschar samtidigt och måste bytas. I mindre RAID:er är risken liten att två hårddiskar går sönder samtidigt, men ju fler diskar RAID-arreyen består av, desto större blir risken för att en disk kraschar.

När det gäller prestanda liknar den RAID 5. Skrivhastigheten är hög, eftersom data- och paritetsblocken kan skrivas på alla diskar, men lästillgången är långsam på grund av den fördröjning som genereras av hoppet av två paritetsserier.

RAID 0+1 and 1+0

För att få bättre prestanda och/eller ytterligare redundans kan standard-RAID-nivåerna kombineras för att skapa hybrida eller sammanvävda RAID-nivåer. RAID-typer som ger redundans kombineras vanligtvis med RAID 0 för att öka prestandan.

Fördelen är att när en disk kraschar i en av nivå 0-arrayerna kan de saknade uppgifterna överföras från den andra arrayen. Om du lägger till en extra hårddisk i ett stripe set krävs det dock att du lägger till en extra hårddisk i de andra stripe seten för att balansera lagringsutrymmet mellan arrayerna.

En nackdel med den här konfigurationen är att den inte automatiskt  återskapar data när två diskar kraschat samtidigt, såvida inte diskarna hört till samma stripe.

RAID 10

RAID 10 är konfigurerad så att RAID 0 delas upp på två RAID 1-arrayer.

En stor fördel med RAID 10 är att alla utom en disk från varje RAID 1-array kan gå sönder utan att data går förlorade. Men om den trasiga disken inte ersätts blir den fungerande disken i den arrayen en ensam riskfaktor för hela systemet, och om även den kraschar går alla data i arrayen förlorad.

Tekniken för RAID kombinationer kan också användas för andra RAID-nivåer, oftast för RAID 5, men den kan också tillämpas på andra nivåer som 3 och 6, vilket ger nivåer som 50, 51, 60, 61, 30 och 03.

RAID 50

 

RAID 50, även kallad RAID 5+0, kombinerar RAID 0:s raka striping på blocknivå med RAID 5:s distribuerade paritet. Som en RAID 0-array som är stripad över RAID 5-element kräver en minimal RAID 50-konfiguration sex hårddiskar. En disk från var och en av RAID 5-seten kan gå sönder utan att data går förlorade. En RAID 50-konfiguration med tre RAID 5-uppsättningar kan till exempel tolerera högst tre potentiella samtidiga diskfel (men endast ett per RAID 5-uppsättning). Eftersom systemets tillförlitlighet är beroende av att den trasiga disken snabbt byts ut så att arrayen kan återuppbyggas, är det vanligt att inkludera hot spares som omedelbart kan börja återuppbygga arrayen vid fel.

RAID 51

RAID 51 skapas genom att spegla eller implementera RAID 1 på en hel RAID 5-array i tillägg till paritetsinformationen. Den skapas generellt med hjälp av mjukvaru- och hårdvarubaserade RAID-tekniker där RAID 1-baserad spegling genomförs via ett operativsystem på den hårdvarubaserade RAID 5-arrayen. RAID 51 är särskilt utformad för ökad tillgänglighet för backup. RAID 51 anses vara en paritetsuppsättning av speglade diskar, varför RAID 5 följs av RAID 1. Den kan fortsätta att fungera eller skydda mot dataförlust även om fyra av de sex minsta konfigurerade diskarna kraschar.

 

 

 

 

 

 

 

 

 

Commonly Used RAID Vocabulary

RAID: RAID är en teknik som stöder användningen av två eller flera hårddiskar i olika konfigurationer för att uppnå högre prestanda, tillförlitlighet och större volymer genom att konsolidera diskresurser och paritetsberäkningar.

Paritet: En matematisk beräkning som tillåter att hårddiskar i en RAID-array går sönder utan att data går förlorade. Det enklaste sättet att förklara detta är ekvationen: A + B = C. Du kan ta bort någon av bokstäverna ovan och räkna ut dess värde med hjälp av de två återstående bokstäverna. Om B tas bort så att ekvationen ser ut som A + ? = C, kan B:s värde

räknas ut genom att flytta A, så att B = C - A. Detta är naturligtvis ett förenklat sätt att beskriva det, och för att fullt ut förstå det i RAID-syfte krävs kunskap om binär teknik och det logiska XOR-uttrycket.

Spegling: Data från en eller flera hårddiskar dupliceras på en annan fysisk disk eller andra fysiska diskar.

Striping: Metod som gör att data och paritet kan skrivas över flera diskar. Uppgifterna skrivs över diskarna i sekventiell ordning fram till den sista disken, varefter den hoppar tillbaka till den första disken och påbörjar en andra stripe.

Block: Ett block är det logiska utrymmet på varje disk där data skrivs. Blockstorleken fastställs av RAID-controllern och är vanligtvis 16 till 256 KB. Data skrivs tills blocket är fullt och fortsätter sedan till nästa enhet, tills den sista enheten då den hoppar till början av nästa stripe.

Vänster/höger-symmetri: Symmetrin i en RAID styr hur data och paritet fördelas mellan enheterna. Det finns fyra huvudtyper av symmetri, vilken som används beror på RAID-leverantören. Vissa företag utvecklar sina egna tekniker för detta utifrån deras egna behov.

Hot Spare: Det finns några olika metoder för att hantera fel på enheter i en RAID, en av dem är användningen av en Hot Spare. Det är en reservdisk som kan användas i stället för den defekta disken.

Degraded mode (försämrat läge): Detta sker när en enhet i RAID:en blir oläsbar, enheten betraktas då som dålig och tas bort från RAID:en. Nya data och paritet skrivs sedan till de återstående enheterna i RAID:en. Om data begärs från den trasiga enheten, räknas det ut med pariteten på de andra enheterna. Detta försämrar RAID-systemets prestanda, därav namnet.

Topics:

RAID Recovery

Prenumerera på vårt nyhetsbrev

Ibas Ontrack AB, Bangårdsgatan 13, 75 320 Uppsala, Sverige (Se alla adresser)