Le aziende vittime di un’interruzione del sistema di posta elettronica possono rischiare di perdere giorni interi di produttività: mentre gli addetti IT cercano disperatamente di risolvere il problema, i costi aumentano in maniera esponenziale ad ogni minuto di inattività. Il malfunzionamento del server di email dimostra come il fatto di disporre di un sistema di data management e restore vi permetta invece di poter usufruire di un ripristino più rapido.
Malfunzionamenti Exchange Server multipli
Una grande azienda manifatturiera ha subito un’inaspettata perdita di dati dal sistema di email a causa di una catena di errori. In un sistema di posta in cluster basato su Exchange per la gestione di oltre 1000 utenti, uno dei server del cluster ha iniziato ad esaurire lo spazio disco a causa della memorizzazione in locale del log file. Poco dopo, un secondo nodo nella batteria dei server ha iniziato a sua volta ad avere problemi in quanto non era in grado di montare l’Information Store.
L’assistenza tecnica di Microsoft ha fornito supporto agli addetti IT nella messa offline del server e dopo aver effettuato le operazioni di repair e un backup, il sistema è tornato operativo.
Il server ha funzionato correttamente per circa un giorno ma gli utenti hanno iniziato a notare problemi di gestione degli appuntamenti e di corruzione dei messaggi. Per risolvere questi problemi è stato implementato un altro server Exchange su cui sono state spostate le caselle di posta degli utenti: questa soluzione sembrava aver stabilizzato i server in cluster. Pochi giorni più tardi il sistema ha avuto un nuovo crash. L’IT ha subito implementato un server di posta temporaneo di modo che gli utenti potessero continuare ad inviare e ricevere email. Tuttavia i dati dei messaggi archiviati non erano più disponibili.
Essendo gli utenti in grado di utilizzare almeno in parte la posta elettronica, il processo ha avuto inizio con l’estrazione delle email archiviate dall’Information Store originale ma il restore dal backup non ha portato ad alcun risultato poichè i dati non erano utilizzabili. A questo punto gli addetti IT hanno continuato a cercare delle soluzioni mentre gli utenti erano ormai alquanto frustrati dopo quasi due settimane di problemi con la posta elettronica.
Mal di testa da backup
L’executive management dell’azienda ha iniziato a richiedere aggiornamenti giornalieri al direttore IT, mentre la frustazione e la tensione tra i dipendenti colpiti dal problema alle email continuava a crescere. Il vendor del software di backup in uso è stato chiamato in azienda e i loro esperti hanno iniziato ad esaminare i log di backup alla ricerca di una soluzione. Da questa verifica è emerso che una tape machine danneggiata all’interno della backup library aveva provocato la corruzione del backup stesso. Sfortunatamente questo aveva corrotto anche tutti gli altri backup presenti. L’unica via per effettuare il restore degli archivi email degli utenti era quella di ricorrere all’Information Store non montabile dei server in cluster. Un’applicazione di riparazione per Exchange (ESEUtil) è stata utilizzata su una copia dell’Information Store da 100GB ma dopo 12 ore non si sapeva se la riparazione avesse avuto successo o se ci fossero reali possibilità di recuperare i dati.
L’aiuto degli esperti
Questa azienda non sapeva più come muoversi: l’hardware non funzionava, i loro tentativi di restore non portavano a nessun risultato e l’IT era ormai esausto. Alla fine si sono affidati ad un’azienda di recupero dati professionale per effettuare l’estrazione delle caselle di posta. In meno di 24 di più di 1400 mailbox sono state ripristinate con successo.
Alla fine, il dipartimento IT ha effettuato il rebuild dell’ambiente server Exchange mentre gli utenti lavoravano su un server temporaneo per poi spostarli sul sistema definitivo.
In questo caso l’IT ha fatto tutto il possibile per recuperare il sistema: si sono rivolti ai vendor e coinvolto l’assistenza tecnica Microsoft sin dall’inizio. Da un punto di vista di business continuity hanno agito correttamente nonostante i continui imprevisti e malfunzionamenti dell’infrastruttura.
Tuttavia, col senno di poi, si sarebbe potuto utilizzare un tool dedicato specificamente alla gestione Exchange per processare l’Information Store originale ed estrarre le mailbox direttamente sul server di email temporaneo.
In questo modo l’IT avrebbe potuto accedere ai dati richiesti senza modificare nessuno dei contenuti dei database interni. ESEUtil, ad esempio, tende a sovrascrivere i metadati e le tabelle dei messaggi se identifica una corruzione non leggibile.