Wenn ein Kunde den größten Teil seines Rechenzentrums durch einen Wasserschaden verliert, ist das nichts, was man auf die leichte Schulter nehmen sollte. Vor kurzem erhielten wir einen Notruf wie diesen. Ein Unternehmen hatte einen Rohrbruch, der Teile seines Rechenzentrums überflutete und physisch beschädigte. Wir machten uns sofort an die Arbeit.
Die Situation
Der Kunde schickte uns 10 Schränke mit insgesamt 1.400 Laufwerken. Dabei handelte es sich um einen Mix aus verschiedenen Speicher- und Softwareherstellern (SAS-, SATA- und FC-Laufwerke von EMC, IBM und Oracle). Allein die Versandlogistik war eine Herausforderung. Um Zeit zu sparen, schickte der Kunde uns ganze LKW Ladungen voller Server Racks unversehrt zu, damit wir sofort mit der Arbeit beginnen konnten.
Die Lösung
Jedes Gehäuse im Rack wurde inspiziert und inventarisiert. Ontrack stellte bei der ersten Gruppe von Racks sichtbare Wasserschäden fest. Dieser Wasserschaden befand sich an den Laufwerken, den Regalen, den Netzteilen für die Speicherprozessoren und den Head Units der Storage-Geräte.
Jedes Laufwerk wurde daraufhin aus dem ursprünglichen Gehäuse entfernt und inventarisiert (mit einem Asset-Tag versehen). Nach der Kennzeichnung wurden die Datenträger zur Triage an das Engineering Services Team übergeben. Zu diesem Zeitpunkt wurde jedes einzelne Medium untersucht und entschieden, ob es genügt wenn das Engineering Service Team ein Abbild (Image) erzeugen sollte (keine sichtbaren Schäden oder Verunreinigungen) oder ob die Medien für zusätzliche Arbeiten im Reinraum bearbeitet werden sollten (Verunreinigungen, sichtbare Schäden, nicht funktionierende Laufwerke).
Alle Medien, bei denen eine Beschädigung oder Verunreinigung festgestellt wurde, wurden in unseren Reinraum mit von Ontrack selbst entwickelten Tools und Techniken repariert.
Von allen Datenträgern wurde ein Sektor für Sektor genaues Abbild (Image) erstellt und dem Kunden wurden beständig Berichte mit den Ergebnissen des Status dieser Arbeiten zur Verfügung gestellt.
Während des Imaging-Prozesses mussten wir in der Lage sein, alle Daten des Kunden zu hosten. Es wurden einige schnelle, aber umfangreiche Anpassungen in unserem Data Center vorgenommen mit der wir in der Lage waren, diese Anforderungen zu erfüllen.
Das Ergebnis
Nachdem alle Daten wiederhergestellt, repariert und auf neue Medien überspielt worden waren, was bei 1.491 Laufwerken ein ziemlicher Kraftakt war, wurden die Storage Systeme physisch und elektronisch auf ihre Funktionsfähigkeit überprüft und wieder zusammengebaut. Erledigt...richtig? Falsch! Nachdem die Geräte dem Kunden in funktionstüchtigem Zustand zurückgegeben worden waren, war es an der Zeit, sein Rechenzentrum wieder aufzubauen. Diejenigen unter Ihnen, die im Bereich Enterprise Storage arbeiten, wissen, dass man die Racks nicht einfach aufstellen und an der Wand anschließen kann. Wir arbeiteten mit dem Kunden zusammen, um alle Festplatten ab dem Zeitpunkt des Ausfalls wiederherzustellen, damit alle Daten vorhanden waren. Wenn ältere Speichersysteme mit neueren Geräten, mehreren Herstellern und Softwareprogrammen zusammenarbeiten, sind einige Ausfälle vorprogrammiert, bis alles wirklich wieder nahtlos zusammenarbeitet. Unsere Techniker unterstützten unseren Kunden, indem sie mit ihm und den OEMs zusammenarbeiteten, um Probleme zu beheben und zu beraten und die richtigen Geräte zu beschaffen, bis alles wieder funktionierte.
Die Zusammenfassung dieses Auftrags lautete wie folgt:
-
Über 15 Ontrack-Mitarbeiter aus Technik, Logistik, Vertrieb und technischem Support standen während des gesamten Prozesses in ständigem Kontakt mit dem Kunden.
-
1.491 gesicherte Festplatten
-
1,2 Petabyte Daten verarbeitet und gespeichert, bis das Rechenzentrum des Kunden wieder voll einsatzfähig war.
-
Der Kunde war in 2,5 Wochen voll funktionsfähig. Wirklich erstaunlich, wenn man bedenkt, wie viel Zeit man eigentlich braucht, wenn man ein Rechenzentrum von Grund auf neu aufbaut, ohne die Daten vorher wiederherstellen zu müssen.
Weitere Informationen: