Technologia RAID zrewolucjonizowała korporacyjne przechowywanie danych.
Skrót RAID tłumaczony z języka agielskiego (Redundant Array of Independent Disks) jako redundantna macierz niezależnych dysków wykorzystuje koncepcję nadmiarowości systemowej (od RAID 1 i wyższych), która w znacznym stopniu minimalizuje przestoje spowodowane awariami poszczególnych dysków.
Niestety, pamięć masowa RAID nie jest technologią idealną i nadal może dochodzić do utraty danych.
Co to jest system pamięci masowej RAID?
Definicja macierzy RAID znajduje się w nazwie samego systemu. Skrót od Redundant Array of Independent Disks (redundantna macierz niezależnych dysków). RAID oznacza dosłownie tworzenie grupy wielu dysków twardych w celu uzyskania jednej partycji logicznej. W zależności od celu i przeznaczenia, macierz RAID zwiększa wydajność dostępu i zapisu danych, jednocześnie poprawiając bezpieczeństwo informacji.
Macierze RAID to technologia, która umożliwia wykorzystanie dwóch lub więcej dysków twardych w różnych konfiguracjach w celu uzyskania większej wydajności, niezawodności oraz większych wolumenów dzięki zastosowaniu konsolidacji zasobów dyskowych i obliczeń parzystości.
Zaprojektowano szereg standardowych konfiguracji, które są określane jako poziomy. Pierwotnie utworzono pięć poziomów macierzy RAID, ale pojawiło się wiele innych wariantów, w szczególności kilka poziomów zagnieżdżonych i wiele poziomów niestandardowych (w większości zastrzeżonych). Wyróżniamy kilka podstawowych poziomów RAID - od RAID 0, RAID 1, … , RAID 5, RAID 0+1, RAID 10.
Lecz co oznaczają poziomy RAID? Liczby te odnoszą się po prostu do konfiguracji macierzy. Wiedząc, że wszystkie systemy RAID skutecznie przechowują dane, wybór systemu będzie opierać się na potrzebach osobistych lub organizacyjnych. Na przykład, macierz RAID 1 spełnia wymagania dotyczące bezpieczeństwa. Macierze RAID 5 to dobry wybór, jeśli szukasz zarówno wydajności, jak i odporności na błędy.
Historia systemu RAID
Koncepcja systemów RAID narodziła się na Uniwersytecie Kalifornijskim w Berkeley, gdzie David A. Patterson, Garth Gibson i Randy H. Katz współpracowali przy tworzeniu operacyjnych prototypów pięciu poziomów systemów pamięci masowej RAID. Wyniki ich badań stały się podstawą złożonych systemów pamięci masowej RAID, które istnieją do dzisiaj. Obecnie IBM posiada prawa własności intelektualnej do macierzy RAID 5.
Konstrukcja systemu pamięci masowej RAID miała na celu poprawę wydajności, odzyskiwania danych, niezawodności i skalowalności pamięci masowej. W rezultacie opracowano unikalną koncepcję nadmiarowości, która oferuje możliwości odzyskiwania danych w przypadku awarii dysku w systemie. W rzeczywistości, karty kontrolerów RAID uzyskały możliwość kontynuowania odczytu i zapisu danych nawet w przypadku, gdy dysk jest w trybie offline.
Przegląd systemu macierzy RAID
RAID jest terminem stosowanym w komputerowych systemach przechowywania danych, które rozprzestrzeniają i replikują dane pomiędzy wieloma dyskami twardymi. Macierze RAID zaprojektowano z myślą o dwóch kluczowych celach: zwiększeniu niezawodności danych oraz zwiększeniu wydajności wejścia/wyjścia.
Macierze RAID łączą fizyczne dyski twarde w jedną jednostkę logiczną przy użyciu specjalnego sprzętu lub oprogramowania. Sprzętowe rozwiązania macierzy RAID mogą być dostępne w różnych wersjach, od tych wbudowanych na płycie głównej lub kart rozszerzeń, aż po duże korporacyjne serwery NAS lub SAN. Przy takich ustawieniach system operacyjny nie jest świadomy działania technicznego ani obecności macierzy RAID. Rozwiązania programowe są zazwyczaj wdrażane w systemie operacyjnym.
W macierzy RAID istnieją trzy kluczowe pojęcia:
- Reprodukcja lustrzana: kopiowanie danych na więcej niż jeden dysk.
- Striping: dzielenie danych na więcej niż jeden dysk.
- Korekta błędów: w przypadku przechowywania nadmiarowych danych w celu umożliwienia wykrycia i ewentualnego usunięcia problemów (tzw. fault tolerance).
Różne poziomy RAID wykorzystują jedną lub więcej z tych technik, w zależności od wymagań systemowych.
RAID jest tradycyjnie stosowana na serwerach, ale może być również stosowana na stacjach roboczych. Ta ostatnia jest szczególnie przydatna w komputerach intensywnie korzystających z pamięci masowej, takich jak te używane do edycji obrazu i dźwięku.
Odzyskiwanie danych w macierzy RAID
Chociaż systemy pamięci masowej RAID są zaprojektowane tak, aby były odporne na błędy, niektóre awarie sprzętowe mogą spowodować, że dane będą niedostępne. Jeśli system napotka takie problemy z macierzą RAID, Ontrack Data Recovery jest ekspertem w zakresie procedur i technik odzyskiwania danych w macierzy RAID.
Nasi inżynierowie są zgodni, że odzyskiwanie danych z macierzy RAID jest jednym z najtrudniejszych aspektów technicznych odzyskiwania danych. Ocena systemu odzyskiwanie danych z macierzy RAID jest w rzeczywistości połączeniem dwóch bardzo ważnych kroków:
-
Pierwszym, i najdłuższym, jest ponowny montaż macierzy. Kiedy inżynierowie Odzyskiwania Danych w macierzy RAID ponownie składają system logiczny, dokładnie badają, jak dane są zorganizowane na wszystkich dyskach. Następnie znają kolejność dysków oraz układ bloków danych i bloków parzystości. Ta inwestycja czasu jest niezbędna do określenia oryginalnej konfiguracji i uzyskania wysokiej jakości odzyskiwania danych,
-
Drugim krokiem jest praca nad logicznym systemem plików. Obecne systemy plików logicznych przedsiębiorstwa są niezwykle złożone. W przypadku awarii macierzy RAID, w systemie plików wystąpią tysiące błędów. Inżynierowie Ontrack Data Recovery sprawdzą i potwierdzą, że macierz jest prawidłowo skonstruowana przed skopiowaniem macierzy.
Konfiguracje macierzy RAID
Konfiguracja logiczna systemu RAID dzieli dane taśmowo na wszystkich fizycznych dyskach. Dzięki temu możliwe jest uzyskanie równomiernej ilości danych na wszystkich nośnikach; zamiast jednego, który wykonuje całą pracę związaną z odczytem i zapisem danych, wszystkie dyski pracują razem. Dane są zatem rozprowadzane na wszystkich fizycznych pamięciach.
Operacje redundantne lub odporne na błędy
Redundancja w obecnej konfiguracji macierzy RAID 5 jest wynikiem zastosowania logicznej funkcji matematycznej o nazwie "Exclusive OR" (XOR). Jest ona powszechnie określana jako parytet. Funkcja XOR jest logicznym procesem binarnym. Najlepiej jest rozważyć parytet jako kombinację bloków danych drugiego dysku. Każdy bajt, który zostanie zapisany do bloku danych, jest obliczany względem pozostałych bloków. Uzyskany parytet jest zapisany w bloku parytetu dla danego pasma. To wyliczenie zawsze będzie działać, niezależnie od brakującego bloku danych. Obliczenie nie będzie jednak działać w przypadku braku dwóch bloków, co jest jednym z ograniczeń macierzy RAID 5; nie zapewni odpowiedniej redundancji w przypadku awarii dwóch lub więcej dysków.
Jak wspomniano wcześniej, karta kontrolera dzieli dane na kasety i wykonuje na nich również funkcję XOR. Ilość obliczeń logicznych wykonywanych przez kontroler co sekundę jest imponująca. Obecne kontrolery RAID są bardzo zaawansowanymi systemami sprzętowymi, w tym procesorami SDRAM i bankami pamięci zaprojektowanymi specjalnie pod kątem wydajności i nadmiarowości.