RAID significa Redundant Array of Independent Disks, o en español, Matriz Redundante de Discos Independientes. Es un conjunto de discos duros independientes capaces de proporcionar redundancia, diseñados para mantener el sistema en línea y que se utilizan principalmente en un entorno de servidores de empresas.
Con la continua caída en los precios de los discos duros, también es cada vez más común encontrar configuraciones RAID en hogares. Aunque estos sistemas no son comparables con los sistemas RAID de clase empresarial, se utilizan a menudo en sistemas de almacenamiento NAS (Network Area Storage, Almacenamiento en Red) de bajo coste que se conectan para conformar una red doméstica para almacenar y compartir vídeos, fotos, música y otros contenidos de entretenimiento entre múltiples dispositivos.
Por otro lado, las arquitecturas empresariales de almacenamiento RAID realizan tareas que son generalmente críticas para el negocio, y su eficiencia y disponibilidad son de suma importancia. Estos sistemas RAID apoyan la operación de entornos virtuales (por ej. VMware y Microsoft Hyper-V), bases de datos (por ej. Microsoft SQL y Oracle), sistemas de correo electrónico como Microsoft Exchange Server y todas las aplicaciones que requieran desempeño, fiabilidad y escalabilidad.
En estas situaciones, el fallo de un sistema RAID combinado con una pérdida de datos es un verdadero desastre que debe ser evitado a toda costa.
Confiar es bueno, pero no confiar es mejor
Los sistemas RAID son más fiables que los HDD o los SSD individuales. Esto es así, porque al utilizar múltiples discos y proporcionar redundancia, pueden tolerar el fallo de una unidad de la matriz y seguir estando en línea. En el caso de un fallo del sistema RAID, la reconstrucción de la información puede ser realizada utilizando la paridad calculada y almacenada durante las operaciones normales de escritura.
Debido a que confiar es bueno, pero no confiar es a veces mejor, a continuación ofrecemos una colección de comentarios y sugerencias de nuestros expertos para ayudarte a trabajar mejor y sentirte más cómodo con tu sistema RAID.
Algunos consejos para trabajar mejor con los sistemas RAID
1. No es cierto que los sistemas RAID no pierdan datos.
Los sistemas RAID limitan el riesgo de pérdida de datos, pero no eliminan completamente el problema: ningún sistema de almacenamiento es inmune a la pérdida de datos.
2. Ten cuidado: ¡no todos los sistemas RAID proporcionan el mismo nivel de redundancia!
Algunas configuraciones RAID no proporcionan tolerancia a fallos, RAID 0 (striping) no proporciona redundancia ni cálculo de paridad. Los datos de estos sistemas son generalmente divididos entre dos discos y el fallo de una de las unidades resultará en una pérdida de datos.
3. RAID funciona incluso si falla una unidad, pero...
Es verdad. En general, a excepción de unos pocos casos, un sistema RAID funciona incluso si un disco falla. Esto es cierto, por ejemplo, para un sistema RAID 5, una de las configuraciones más comunes. Sin embargo, el fallo de un disco en una configuración RAID 5 no debe prolongarse. Debes sustituir el disco afectado a la brevedad posible, porque un fallo en una segunda unidad provocará una pérdida de datos.
4. ...RAID no tolera el fallo de dos discos
Las configuraciones RAID 5 no toleran el fallo de dos discos. La tolerancia a fallos de dos unidades sí es soportada por la configuración RAID 6 y funciona utilizando doble paridad. En entornos que requieren alta tolerancia a fallos, es preferible una configuración RAID 6. Si el objetivo es el desempeño, RAID 5 puede proporcionar un buen compromiso entre la seguridad y el desempeño porque las operaciones de escritura son más rápidas en sistemas RAID 5, ya que los cálculos de paridad son ‘sencillos’ en comparación con los cálculos en RAID 6.
5. Sustitución de un disco con fallos
Normalmente, los sistemas RAID están conformados por discos duros de marca, modelo y capacidad similar. Cuando falle una unidad, es posible que una segunda unidad deje de funcionar poco después. Siempre que sea posible, te recomendamos el uso de una unidad idéntica de modo que todas las unidades del sistema RAID tengan las mismas características, no sólo en términos de capacidad, sino también de desempeño. ¡Nunca reemplaces la unidad con una unidad que anteriormente fue parte de otro sistema RAID!
6. Reconstruir sí, reconstruir no
La operación de reconstrucción, como su nombre lo indica, reconstruye la matriz RAID en caso de problemas en una unidad. Muchos sistemas RAID ofrecen un ‘hot plug’ (conexión en caliente) que te permite quitar y reemplazar el disco duro sin necesidad de bajar el sistema y, en consecuencia interrumpir el servicio. La reconstrucción de una matriz RAID usualmente toma mucho tiempo, pero es preferible a la regeneración de los datos desde cero. Sin embargo, si algo falla en el procedimiento de reconstrucción, la operación causará un daño adicional. La realización de una reconstrucción no está exenta de riesgos y sólo debe hacerse si cuentas con una copia de seguridad actualizada y funcionando.
7. Recuerda numerar las unidades
Las unidades de un sistema RAID tienen una posición específica en la matriz. Registrar la posición física en una cadena RAID numerando cada unidad te facilitará muchísimo la vida en caso de que necesites reconstruir la matriz RAID o si necesitas enviar las unidades a un servicio de recuperación de datos. En los sistemas de hoy en día, cada disco individual tiene un área de almacenamiento reservada con información RAID oculta, por lo que conocer la ubicación física de la unidad puede no ser imprescindible. En estos casos, en qué ubicación se coloca cada unidad no hace la diferencia. Incluso sacando unidades al azar y volviendo a colocarlas en un orden diferente no debería dañar la instalación, siempre y cuando la información RAID siga siendo válida (pero, por desgracia, en muchos casos esta área se daña o se sobrescribe).
8. No utilices un utilitario de reparación en caso de corrupción de datos en un sistema RAID
Problemas del controlador, o fallas de energía pueden corromper el sistema de archivos o tornar los datos inaccesibles. No ejecutes utilitarios para reparar los volúmenes, ya que estos programas realizan operaciones de escritura y podrían dañar aún más la estructura lógica de los datos, haciendo que la recuperación de los datos sea más difícil.
9. Cuidado con las “opciones por defecto”
La mayoría de los usuarios suelen utilizar el sistema con las configuraciones por defecto. Sin embargo, algunos especialistas pueden modificar estas opciones para que el sistema RAID sea más seguro de lo que lo fue originalmente, es decir, implementando una configuración RAID 6. En caso de errores, los usuarios suelen ser propensos a probar diferentes opciones, incluyendo la restauración de las opciones por defecto. Esto puede hacer que una configuración RAID 5 sobrescriba a la RAID 6 con la consiguiente pérdida de datos.
10. ¡Apaga el sistema de inmediato!
En caso de una pérdida de datos debido a un borrado accidental, corta la corriente del sistema de inmediato. Este método ‘no convencional’ es necesario porque la función de apagado normal podría sobrescribir las áreas de disco donde hay datos que deben ser recuperados. Si un disco duro hace ruidos extraños, el procedimiento es el mismo, aunque en este caso el objetivo es reducir la extensión del daño físico (típicamente un fallo del cabezal, en el cual el cabezal causa ranuras en el disco eliminando la capa magnética donde se almacenan los datos).
11. Realiza copias de seguridad... ¡por favor!
Si estás pensando en realizar cambios en el sistema RAID, detente si no estás seguro de tener una copia de seguridad actualizada y funcionando. Trabajar en una configuración RAID o modificarla puede conducir accidentalmente a una pérdida de datos que podrá ser resuelta mediante la restauración de la copia de seguridad.
12. Cómo restaurar una copia de seguridad
Resiste la tentación de restaurar la copia de seguridad directamente en el sistema RAID en el cual se han perdido los datos. Si la copia de seguridad no está actualizada o funcionando, o el procedimiento no tiene éxito, lo que lograrás es una operación de sobrescritura sobre la única fuente (el sistema RAID original) que se puede utilizar para recuperar los datos.
13. Soporte técnico del fabricante del hardware
En caso de un fallo del sistema RAID, es habitual llamar al soporte técnico proporcionado por el fabricante del hardware, especialmente en sistemas avanzados y complejos. Recuerda que el objetivo de la asistencia técnica es tener el RAID en marcha y funcionando, no preservar los datos en el sistema. Los técnicos involucrados reemplazarán la(s) unidad(es) con fallo(s) y configurarán el sistema para que vuelva a funcionar. ¿Y tus datos? Habla con el soporte técnico del fabricante explicando que puede que tengas que consultar a un servicio de recuperación de datos. Recuerda que aquí hay un conflicto de intereses: el fabricante quiere que tu sistema vuelva a funcionar perfectamente, a menudo a expensas de tus datos.
14. Se perdieron datos. Y ahora, ¿qué hacemos?
La complejidad de una recuperación RAID obedece a tres factores:
- RAID es un sistema compuesto de varios discos en los que se escriben los datos, organizados de una manera que es completamente diferente a un único disco duro
- Los datos en los sistemas RAID, en la mayoría de los casos, tienen estructuras lógicas complejas, por ejemplo, máquinas virtuales o bases de datos
- Las configuraciones RAID de clase empresarial utilizan una arquitectura de hardware compleja y avanzada y a menudo hardware propietario
Recuperar datos es posible, pero la elección del proveedor es realmente crítica para el éxito de la recuperación de los datos. Selecciona una empresa de recuperación de datos reconocida en el mercado y que te pueda ofrecer la experiencia necesaria para manejar estas complejas recuperaciones de RAID. En muchos casos se requiere el desarrollo de herramientas específicas o la adaptación de herramientas existentes al escenario actual, algo que tu servicio de recuperación de datos debería ser capaz de desarrollar en su centro de investigación. Por último, tu empresa de recuperación de datos debe ofrecer servicios de recuperación de datos 24/7, ya que los sistemas RAID suelen ser críticos para el negocio y tienen que volver a funcionar tan pronto como sea posible para reducir el coste del tiempo de inactividad.