Taustatietoa RAID-järjestelmistä

Written By: Ontrack

Date Published: 7. elokuuta 2023 klo 5.45.26

Taustatietoa RAID-järjestelmistä

Mikä on RAID?

RAID (Redundant Array of Independent Disks, alun perin Redundant Array of Inexpensive Disks) -tallennus on mullistanut yritysten käyttämän tallennusteknologian. Se on parantanut järjestelmien luotettavuutta redundanssilla (RAID 1 ja sitä ylemmät tasot), jolla voidaan minimoida yksittäisten asemien vikaantumisesta johtuvat käyttökatkokset.

Valitettavasti RAID ei ole täysin virheetön teknologia, joten tietoja voi hävitä myös näitä järjestelmiä käytettäessä.

RAIDin määritelmä on sen nimessä. Redundant Array of Independent Disks tarkoittaa itsenäisten levyjen redundanttia ryhmää – yhden loogisen yksikön muodostavia kiintolevyjä. Käyttötarkoituksesta riippuen RAID parantaa luku- ja kirjoitusnopeutta ja tietojen luotettavuutta.

RAID on erilaisia kiintolevykokoonpanoja tukeva tekniikka, joka parantaa suorituskykyä, lisää luotettavuutta ja mahdollistaa suuremmat asemakoot levyresurssien yhdistämisen ja pariteettilaskelmien avulla.

RAID-vakiokonfiguraatioita kutsutaan tasoiksi. Alun perin luotiin viisi tasoa, mutta niistä on kehitetty monia muunnelmia, mukaan lukien useita sisäkkäisiä tasoja ja monia epästandardeja (useimmiten itse kehitettyjä) tasoja.

Mitä eri RAID-tasot sitten tarkoittavat? Tasonumerot viittaavat RAID-kokoonpanoihin. Kun tiedetään, että kaikki RAID-järjestelmät tallentavat tietoa tehokkaasti, järjestelmän valinta perustuu yrityksen omiin tarpeisiin. Esimerkiksi RAID 1 täyttää suorituskyvyn ja luotettavuuden tarpeet. RAID 5 on hyvä valinta, jos tarvitaan sekä suorituskykyä että vikasietoisuutta.

 
what-is-raid

RAID-järjestelmän kuvaus

RAID (Redundant Array of Independent Disks) -termillä tarkoitetaan tietokoneiden tallennusjärjestelmiä, jotka jakavat ja/tai replikoivat tietoa useille kiintolevyille. RAID suunniteltiin kahta päätavoitetta silmällä pitäen: tietojen luotettavuuden lisääminen ja luku- ja kirjoitusnopeuden (I/O-suorituskyky) parantaminen.

RAID yhdistää fyysiset levyt yhdeksi loogiseksi yksiköksi käyttämällä erityisiä laitteita tai ohjelmistoja. Laitteistopohjaisia RAID-ratkaisuja on monenlaisia, aina emolevylle rakennetuista järjestelmistä tai lisäkorteista suurten yritysten NAS- ja SAN-palvelimiin. Tämän tyyppisissä ratkaisuissa käyttöjärjestelmä ei ole tietoinen käytetystä teknologiasta. Ohjelmistoratkaisut toteutetaan yleensä käyttöjärjestelmässä.

RAIDin kolme keskeistä käsitettä ovat:

  • peilaus eli tietojen kopioiminen useammalle kuin yhdelle levylle
  • lomitus eli tietojen jakaminen useammalle kuin yhdelle levylle
  • virheenkorjaus eli redundanttinen tieto tallennetaan siten, että ongelmat voidaan havaita ja korjata (tunnetaan vikasietoisuutena)

Yhtä tai useampaa näistä tekniikoista voidaan käyttää eri RAID-kokoonpanoissa järjestelmän vaatimusten mukaan.

RAIDia käytetään perinteisesti palvelimissa, mutta sitä voidaan käyttää myös työasemissa. Jälkimmäinen on tyypillistä paljon tallennustilaa vaativissa työasemissa, kuten video- ja äänieditointiin käytettävissä tietokoneissa.

 
raid-recovery-tips

RAID-järjestelmän historia

RAID on lyhenne sanoista Redundant Array of Inexpensive Disks (myöhemmin Redundant Array of Independent Disks). Konsepti syntyi Kalifornian yliopistossa Berkeleyssä, jossa David A. Patterson, Garth Gibson ja Randy H. Katz tuottivat toimivat prototyypit RAID-tallennusjärjestelmien viidestä tasosta. Heidän tutkimuksensa tulos muodosti perustan nykypäivän monimutkaisille RAID-tallennusjärjestelmille. IBM omistaa nykyään RAID 5:n immateriaalioikeudet.

RAID-tallennusjärjestelmän kehitystyön tavoitteena oli parantaa tallennusjärjestelmän suorituskykyä, palautettavuutta, luotettavuutta ja skaalautuvuutta. Tuloksena oli ainutlaatuinen redundanssiin perustuva konsepti, jossa tiedot voidaan palauttaa siinä tapauksessa, että jokin järjestelmän levyasemista vikaantuu. RAID-ohjainkortit voivat jatkaa tietojen lukemista ja kirjoittamista, vaikka levy olisi offline-tilassa.

 

Erityyppiset RAID-järjestelmät

Ibas Ontrack tarjoaa tiedonpalautuspalveluita kaikille keskeisille RAID-arkkitehtuureille. Niihin kuuluvat RAID-tasot 0, 00, 1, 10, 1E, 1E0, 2, 3, 4, 5, 50, 5E, 5EE, 6 ja 60. Palautamme tietoa myös monista asiakaskohtaisista RAID-järjestelmistä.

Kehittämällä ohjelmistotyökalujamme jatkuvasti varmistamme, että käytössämme ovat aina alan viimeisin teknologia ja itse kehittämämme tekniikat parhaan mahdollisen lopputuloksen saavuttamiseksi. Lisäksi tutkimus- ja kehitystiimimme auttaa asiantuntijoitamme palauttamaan tietoja epätavallisista RAID-järjestelmistä tapauskohtaisesti räätälöitävien työkalujen avulla.

Useimmat RAID-järjestelmien toimittajat, kuten HP, Dell, Adaptec, IBM, Intel, Promise, EMC, NetApp ja LSI Logic, suosittelevat meitä.

RAID-järjestelmän tyypin määrittää sen kokoonpano, mukaan lukien käytettyjen levyjen määrä. RAID (Redundant Array of Independent Disks) on tallennusratkaisu, jossa data jaetaan tai replikoidaan useisiin levyasemiin, jotka muodostavat yhtenäisen järjestelmän. RAID-järjestelmä on paitsi edullisempi kuin yksittäinen, tehokas ja siksi kallis kiintolevy, myös erittäin suorituskykyinen ja luotettava, koska se sietää paremmin vikoja.

Nykyään on olemassa lähes kaksikymmentä RAID-kokoonpanotyyppiä, ellei jopa useampia, jos mukaan luetaan jo vanhentuneina pidetyt kokoonpanot, kuten RAID 2. Yleisimmät RAID-kokoonpanot ovat RAID 0, RAID 1, RAID 10, RAID 5 ja RAID 6.

RAID 0 käyttää vähintään kahta levyä. Se tarjoaa nopean luku- ja kirjoitusnopeuden, mutta ei redundanssia. RAID 1 peilaa samat tiedot kahdelle levylle, joten se tarjoaa alhaisimman RAID-vikasietoisuustason. Jos yksi levy vikaantuu, tiedot ovat tallessa toisella levyllä. RAID 5 kehitettiin tarkoituksena yhdistää RAID 0:n suorituskyky ja RAID 1:n vikasietoisuus. RAID 5 on yleinen kokoonpano, joka tarjoaa hyvän kompromissin luotettavuuden ja suorituskyvyn välillä. RAID 6 perustuu RAID 5 -konseptiin, mutta siinä vikasietoisuutta kasvatetaan kaksoispariteetilla eli järjestelmä sietää kahden levyn vikaantumisen yhden sijaan.

 

RAID 0
RAID 0 on yksinkertaisin lomitusta käyttävä RAID-kokoonpano, jossa tiedot lomitetaan kaikille levyille, minkä myötä luku- ja kirjoitusnopeus parantuu. Parempi suorituskyky sisältää kuitenkin riskin: jos yksi tai useampi levy lakkaa toimimasta RAID 0:ssa, voi tapahtua vakava tietojen menetys.

Esimerkki palautustilanteesta: on luotu tiedosto, joka täyttää tietoraidat 1–4. Jos levy 2 vikaantuu ja 2. raita katoaa, tiedosto todennäköisesti korruptoituu. Ja toisaalta, jos yksi levy vikaantuu, suurin mahdollinen toimiva tiedosto on pienempi kuin toimivien raitojen yhteenlaskettu koko.
 
RAID 1
Tällä RAID-tasolla tiedot peilataan eli monistetaan ensisijaiselta kiintolevyltä toiselle levylle. Tämä RAID-taso ei paranna suorituskykyä, mutta se tarjoaa tietojen varmuuskopioinnin: tiedot ovat aina käytettävissä, vaikka yksi levy vioittuisi.
 

RAID 2

 

Erillisellä pariteettiasemalla varustettu RAID 2 käyttää bittitason raidoitusta. Tämä taso käyttää hamming-koodia virheenkorjaukseen, ja se on tarkoitettu käytettäväksi asemissa, joissa ei ole sisäänrakennettua virheenkorjausta. Tästä syystä RAID 2 ei enää ole yleisessä käytössä.

 

RAID 3 and 4

 

Myös RAID 3 ja 4 käyttävät raidoitusta erillisellä pariteettiasemalla. Ero näiden kahden välillä on, että RAID 3 käyttää tavutason raidoitusta, kun taas RAID 4 käyttää lohkotason raidoitusta. RAID 3 -tasoa käytetään nykyään harvoin johtuen tavutason raidoituksen heikosta suorituskyvystä. Lohkotason raidoitusta käyttävä RAID 4 on parempi, mutta kärsii silti hitaammasta kirjoitusnopeudesta, koska pariteetti on päivitettävä jokaisella kirjoituskerralla.

 

RAID 5
RAID 5 -tasoa pidetään yleensä parhaana kompromissina vikasietoisuuden, nopeuden ja kustannusten välillä. Järjestelmä jakaa tiedot samalla tavalla kuin RAID 0, mutta se kirjoittaa pariteettitietoa tasaisesti kaikille järjestelmään kuuluville levyille. Jokaisella RAID-toimittajalla on oma tapansa jakaa pariteettitiedot asemien kesken, mutta pääasiallisia tapoja on neljä: vasen epäsymmetrinen, vasen symmetrinen, oikea epäsymmetrinen ja oikea symmetrinen.

Pariteetin suunta on helppo tunnistaa: se ”liikkuu” sekä oikealle että vasemmalle. Epäsymmetrisissä RAID-järjestelmissä tietoraidat ohittavat pariteetin, kunnes ne saavuttavat seuraavan käytettävissä olevan tilan. Symmetriset RAID-järjestelmät käsittelevät tietoraitoja hieman monimutkaisemmalla tavalla: kun tiedot kohtaavat pariteettilohkon, ne liikkuvat sivuttain ja alaspäin seuraavaan raitasarjaan.
 

RAID 6

 

RAID 6 perustuu RAID 5 -konseptiin: se jakaa tiedot ja pariteetin samalla tavalla, mutta luo lisäpariteettilohkon jokaiselle raidalle. Tämä tarkoittaa, että tiedot voidaan palauttaa, vaikka kaksi kokoonpanon levyä vikaantuisi. Pienemmissä RAID-kokoonpanoissa kahden kiintolevyn yhtäaikainen vikaantuminen on epätodennäköistä, mutta RAID-järjestelmän koon kasvaessa myös vikaantumisen todennäköisyys kasvaa. 

Suorituskyvyn suhteen RAID 5 ja RAID 6 ovat hyvin samankaltaisia: kirjoitusnopeus on suuri, koska tieto- ja pariteettilohkot voidaan kirjoittaa kaikille levyille, mutta lukunopeus on pieni kaksoispariteetin aiheuttaman viiveen takia.
 
RAID 0+1 and 1+0
Suorituskyvyn ja/tai ylimääräisen redundanssin saavuttamiseksi RAID-vakiotasoja voidaan yhdistää hybridi- tai sisäkkäisten RAID-tasojen luomiseksi. Redundanssin tarjoavat RAID-tyypit yhdistetään tyypillisesti RAID 0 -tasoon suorituskyvyn parantamiseksi.

Etuna on, että yhden levyn vikaantuessa RAID 0 -levyryhmästä, puuttuvat tiedot voidaan siirtää toisesta levyryhmästä. Ylimääräisen kiintolevyn lisääminen yhteen raitaan edellyttää kuitenkin ylimääräisen kiintolevyn lisäämistä myös muihin raitoihin tallennuksen tasapainottamiseksi kokoonpanojen välillä.

Tämän kokoonpanon haitta on, että se ei voi palautua kahden levyn samanaikaisesta vikaantumisesta, elleivät ne ole samasta tietoraidasta. Jos kaaviossa esitetyt levyt 1 ja 5 vikaantuvat, RAID voidaan uudelleenrakentaa, mutta levyjen 1 ja 4 vikaantuminen johtaisi tietojen menetykseen.
 

RAID 10

 

RAID 10 -kokoonpanossa RAID 0 jakautuu kahden RAID 1 -kokoonpanon kesken.

Etuna on, että useampi levy voi vikaantua ilman tietojen menetystä, kunhan vähintään yksi kummastakin RAID 1 -levyryhmän levystä toimii. Jos vaurioituneita levyjä ei kuitenkaan vaihdeta, levyryhmän ainoasta toimivasta levystä tulee koko järjestelmän kriittinen piste: jos se vikaantuu, kaikki järjestelmän tiedot menetetään.

Sisäkkäisyyttä voidaan käyttää myös muilla RAID-tasoilla, useimmiten RAID 5:ssä, mutta myös RAID 3:ssa ja 6:ssa, mikä tuottaa esimerkiksi tasot 50, 51, 60, 61, 30 ja 03.
 

RAID 50

 

RAID 50, josta käytetään myös nimitystä RAID 5+0, yhdistää RAID 0:n suoran lohkotason raidoituksen RAID 5:n jaettuun pariteettiin. Koska RAID 0 raidoittaa tiedot RAID 5 -tason levyille, RAID 50:n vähimmäiskokoonpanoon tarvitaan kuusi levyä. Yksi levy kustakin RAID 5 -levysarjasta voi vikaantua ilman tietojen menetystä: esimerkiksi RAID 50 -kokoonpano, joka sisältää kolme RAID 5 -levysarjaa, sietää enintään kolmen levyn samanaikaisen vikaantumisen (mutta vain yhden kutakin RAID 5 -levysarjaa kohti). Koska järjestelmän luotettavuus riippuu viallisen aseman nopeasta vaihtamisesta, siihen sisällytetään usein ”hot spare” -varalevyjä, jotka voivat aloittaa järjestelmän uudelleenrakentamisen välittömästi sen vikaantuessa.

 

RAID 51

 

RAID 51 toteutetaan peilaamalla tai toteuttamalla RAID 1 koko RAID 5 -kokoonpanoon pariteettitietojen lisäksi. Se luodaan yleensä ohjelmisto- ja laitteistopohjaisilla RAID-tekniikoilla, joissa laitteistopohjaisen RAID 5 -kokoonpanon RAID 1 -peilaus toteutetaan käyttöjärjestelmän läpi. RAID 51 on suunniteltu erityisesti varmuuskopioiden käytettävyyden ja vikasietoisuuden parantamiseksi. RAID 51 pidetään peilattujen levyjen pariteettisarjana, jossa RAID 5:ttä seuraa RAID 1. Se voi pysyä toimintakunnossa tai suojata tiedot katoamiselta jopa sen jälkeen, kun neljä kuudesta vähimmäiskokoonpanon levystä on menetetty. 

 

 

 

 

 

Yleisesti käytetyt RAID-termit

RAID: RAID on erilaisia kiintolevykokoonpanoja tukeva tekniikka, joka parantaa suorituskykyä, lisää luotettavuutta ja mahdollistaa suuremmat asemakoot levyresurssien yhdistämisen ja pariteettilaskelmien avulla.

Pariteetti: Matemaattinen Boolean-funktio, jonka ansiosta minkä tahansa yksittäisen levyaseman rikkuessa kaikki tiedot saadaan talteen. Yksinkertaisin tapa kuvata tätä funktiota on yhtälö A + B = C. Jos jokin yhtälön kirjaimista poistetaan, sen arvo voidaan laskea kahden jäljellä olevan kirjaimen perusteella. Jos esimerkiksi B poistettaisiin, yhtälöksi tulisi A + ? = C, ja B:n arvo voitaisiin laskea yhtälöllä B = C – A. Tämä yhtälö on karkea yksinkertaistus, ja sen ymmärtämiseen RAID-kontekstissa vaaditaan binääriprosessien ja loogisen XOR-funktion tuntemusta.

Peilaus: Tietojen monistaminen yhdeltä tai useammalta kiintolevyltä toisille fyysisille levyille.

Lomitus/raidoitus: Menetelmä, jolla tiedot ja pariteetti voidaan kirjoittaa useille levyille. Tiedot kirjoitetaan asemille peräkkäisessä järjestyksessä, kunnes ne saavuttavat viimeisen aseman. Sitten järjestelmä hyppää takaisin ensimmäiseen asemaan ja aloittaa toisen raidan jne.

Lohko: Lohko on kunkin levyn looginen muistitila, johon tiedot kirjoitetaan. RAID-ohjain määrittää tilan koon, joka on useimmiten 16–256 kt. Tallennettava tieto täyttää muistitilaa, kunnes sen raja saavutetaan ja siirrytään seuraavaan asemaan. Viimeisen aseman jälkeen järjestelmä hyppää takaisin ensimmäiseen asemaan ja aloittaa seuraavan raidan.

Vasen/oikea symmetria: RAIDin symmetria ohjaa tietojen ja pariteettien jakautumista levyasemien kesken. On olemassa neljä pääasiallista symmetriaa, joita voidaan käyttää RAID-toimittajan mukaan. Jotkut yritykset laativat myös omia tyylejä liiketoimintatarpeidensa mukaan.

Hot spare: On olemassa muutamia eri tapoja käsitellä vikaantuneita levyasemia RAID-kokoonpanossa. Yksi tapa on ”hot spare” -varalevyn käyttäminen vikaantuneen levyn tilalla.

Hidastunut tila: Tämä tapahtuu, jos RAID-levyasemasta tulee lukukelvoton. Aseman katsotaan olevan viallinen, ja sen käyttö lopetetaan RAID-kokoonpanossa. Uudet tiedot ja pariteetti kirjoitetaan sitten RAID-kokoonpanon jäljellä oleville asemille. Jos vikaantuneelta asemalta pyydetään tietoja, ne saadaan muilta levyiltä pariteettien avulla. Tämä toimivien levyasemien väheneminen heikentää RAIDin suorituskykyä.

Topics:

RAID Recovery

Tilaa

Luna House, Mannerheimintie 12 B 5krs.m Helsinki, 00100, Suomi (Katso kaikki sijainnit)