Rewolucja “Big Data” stała się faktem, ale wraz ze wzrostem możliwości analizowania i zarządzania danymi, zwiększa się także ich objętość - obecnie każde przedsiębiorstwo chce przechowywać dane na potrzeby ich bieżącego lub późniejszego przetwarzania. Tak powstaje samonakręcajaca się spirala, przez którą rośnie presja na administratorów, żeby tworzyli pojemniejsze i wydajniejsze archiwa danych. Wyzwanie jest ogromne. Tradycyjne rozwiązania (SAN, RAID czy NAS) mają tę wadę, że wraz ze wzrostem pojemności, rosną też koszty ich tworzenia i rozbudowywania, maleje natomiast ich szybkość, stabilność i bezpieczeństwo. Alternatywą jest SDS, czyli Software Defined Storage (pamięć masowa zdefiniowana programowo), oferujący większą elastyczność, dzięki zastosowaniu oprogramowania, które niezależnie od sterowników wbudowanych na stałe w same nośniki, jest w stanie zarządzać zasobami pamięci masowej, dostępnymi w sieci.
Istota SDS
Idea pamięci masowej zdefiniowanej programowo opiera się na próbie przezwyciężenia ograniczeń dotychczasowych rozwiązań. SDS tworzą w tym celu wirtualne systemy pamięci masowych, które definiowane są przez oprogramowanie, niezależne od warstwy fizycznej. SDS grupuje fizyczne pamięci masowe, pochodzące często od różnych dostawców, w celu jak najbardziej efektywnego wykorzystania ich pojemności. Dzięki temu administrator może poprawić wydajność całej sieci - niektórzy producenci tego typu rozwiązań reklamują się możliwością podniesienia wydajności systemu nawet pięciokrotnie w stosunku do systemów opartych tylko na sprzęcie!
Oczywiście implementacja takiego rozwiązania nie jest wcale prosta - zwłaszcza w przypadku bardzo rozbudowanych sieci, ale wysiłek ten może się opłacić. Przede wszystkim zyskujemy możliwość pełnego zintegrowania wszystkich dotychczas używanych systemów, a także stosunkowo prostego dodawania nowych dysków i urządzeń magazynujących. Nawet jeśli implementacja systemu lub jego rozbudowa nie pójdą nam tak łatwo, możemy liczyć na wsparcie techniczne producenta oprogramowania, który pomoże nam wykorzystać w pełni możliwości swojego produktu.
Podstawowa zasada działania SDS jest prosta: w zależności od tego jak zbudowany jest Twój system, odpowiednie elementy oprogramowania SDS zostaną zainstalowane i skonfigurowane na wszystkich urządzeniach wykorzystywanych w sieci. Zadaniem oprogramowania jest dostarczenie wszelkich funkcji potrzebnych do tego, żeby wszystko działało tak jak powinno. Jeśli więc administrujemy trzema serwerami, z których każdy połączony jest z np. odrębna siecią SAN, dzięki SDS będziesz mógł wykorzystywać całą dostępną przestrzeń pamięci, bez względu na to, w której sieci się ona fizycznie znajduje. W ten sam sposób możliwe będzie dodawanie kolejnych sieci i urządzeń.
Korzyści z SDS są oczywiste, ale…
Dzięki SDS mamy możliwość lepszej integracji istniejących systemów, zwiększenia ich wydajności, przy równoczesnym zmniejszeniu kosztów późniejszego rozwoju zasobów. Nic więc dziwnego, że tego typu rozwiązanie stało się w ostatnim czasie gorącym trendem, a kosztowne rozwiązania oparte na sprzęcie i wbudowanych sterownikach, switchach i procesorach odchodzą powoli w przeszłość. Wiąże się to jednak także z ryzykiem…
Odzysk danych zapisanych przy wykorzystaniu SDS można porównać do odzyskiwania danych z macierzy RAID. Jest to bardzo złożone zadanie, z uwagi na stosowanie własnych standardów zapisu oraz różnych metod implementacji SDS przez każdego z producentów. Musimy pamiętać, że podczas konfiguracji systemu SDS, oprogramowanie stworzy własną "maskę systemową", która będzie nadrzędna w stosunku do sterowników, systemu plików i konfiguracji użytych na fizycznym nośniku. W związku z tym odzyskanie danych w przypadku awarii systemu (błąd podczas konfiguracji, usunięcie danych systemowych) może być bardzo skomplikowanym, czasochłonnym i kosztownym procesem.
Wystarczy wyobrazić sobie strukturę danych, istniejącą w takiej sieci. Oprogramowanie tworzy na wszystkich dostępnych urządzeniach wirtualną strukturę wspólnej pamięci i ta warstwa dopiero zawiera poszczególne dane, albo nawet kolejne struktury danych, takie jak bazy danych, maszyny wirtualne, itd. System przypomina więc rosyjską matrioszkę, po otwarciu której natrafiamy na kolejne, coraz mniejsze struktury.
W celu odzyskania danych niezbędne jest przeprowadzenie procesu odtworzenia konfiguracji użytej w systemie SDS, dopiero to umożliwia dostęp do "surowych danych" przechowywanych w systemie. Specjalistyczne laboratoria odzyskiwania danych radzą sobie już wprawdzie z tym problemem, ale lepiej zapobiegać niż leczyć. Poniżej przedstawiam podstawowe zasady bezpiecznego korzystania z SDS, które może są oczywiste, ale wciąż wielu o nich zapomina.
Podstawowe zasady bezpieczeństwa SDS:
- Wprowadź zaawansową strategię ochrony danych i plan na wypadek sytuacji kryzysowej.
- Bez kopii zapasowej ani rusz! System backupowy musi być sprawdzonyi aktualny.
- Pamiętaj o kopii zapasowej ustawień systemowych! W przypadku awarii sama kopia danych nie wystarczy - musisz posiadać również kopię wszystkich ustawień konfiguracyjnych, które umożliwią Ci odtworzenie tych danych.
- Sprawdzaj kopię zapasową! Cykliczne sprawdzanie kopii zapasowych i testowanie procesu ich przywracania jest absolutnie niezbędne. W przypadku jeśli coś pójdzie źle w sytuacji awaryjnej - koszty mogą być ogromne!