El almacenamiento en conjuntos redundantes de discos independientes (RAID), ha revolucionado la tecnología de almacenamiento de datos empresariales, incorporando la tranquilidad de la redundancia (desde RAID 1 en adelante) que puede minimizar en gran medida el tiempo de inactividad sufrido debido a fallos de unidades individuales. Desgraciadamente, el almacenamiento RAID no es una tecnología perfecta y, como consecuencia, pueden producirse pérdidas de datos.
¿Qué es RAID?
La definición de RAID está en el propio nombre del sistema. RAID, siglas de Redundant Array of Independent Disks (matriz redundante de discos independientes), significa literalmente agrupación redundante de discos independientes: una agrupación de varios discos duros para obtener una única partición lógica. Dependiendo de su finalidad, RAID aumenta el rendimiento de acceso y escritura de datos, al tiempo que mejora la seguridad de la información.
RAID
RAID es una tecnología que admite el uso de 2 o más discos duros en varias configuraciones con el fin de lograr un mayor rendimiento, fiabilidad y mayores tamaños de volumen mediante el uso de la consolidación de recursos de disco y cálculos de paridad.
Se diseñaron una serie de configuraciones estándar denominadas niveles. Originalmente se crearon cinco niveles RAID, pero han evolucionado muchas más variaciones, en particular varios niveles anidados y muchos niveles no estándar (en su mayoría propietarios).
¿Cómo funciona el RAID?
¿Entonces, qué significan los niveles RAID? Los números se refieren simplemente a la configuración del RAID. Sabiendo que todos los sistemas RAID almacenan datos de forma eficiente, la elección del sistema se basará en sus propias necesidades personales. El RAID 1, por ejemplo, satisface las necesidades de rendimiento y fiabilidad. El RAID 5 es una buena elección si lo que busca es rendimiento y tolerancia a fallos.
Descripción general del sistema RAID
RAID es un término utilizado para los esquemas de almacenamiento de datos informáticos que distribuyen o replican datos entre varias unidades de disco duro. RAID se diseñó con dos objetivos clave: aumentar la fiabilidad de los datos y aumentar el rendimiento de E/S (entrada/salida).
Un RAID combina discos duros físicos en una única unidad lógica utilizando hardware o software especial. Las soluciones RAID de hardware pueden ser de varios tipos, desde las integradas en la placa base o las tarjetas complementarias, hasta los servidores NAS o SAN para grandes empresas. Con estas configuraciones, el sistema operativo desconoce el funcionamiento técnico del RAID. Las soluciones de software suelen implementarse en el sistema operativo.
Hay tres conceptos clave en RAID:
- Mirroring, la copia de datos en más de un disco
- Striping, la división de datos en más de un disco
- Corrección de errores, en la que los datos redundantes se almacenan para permitir que los problemas se detecten y, posiblemente, se solucionen (lo que se conoce como tolerancia a fallos)
Los distintos niveles RAID utilizan una o varias de estas técnicas, en función de los requisitos del sistema.
El RAID se utiliza tradicionalmente en servidores, pero también puede emplearse en estaciones de trabajo. Esto último es especialmente cierto en ordenadores de almacenamiento intensivo, como los utilizados para la edición de vídeo y audio.
RAID es el acrónimo de Redundant Array of Inexpensive Disks (matriz redundante de discos independientes). El concepto nació en la Universidad de California, Berkeley, donde David A. Patterson, Garth Gibson y Randy H. Katz colaboraban para producir prototipos operativos de cinco niveles de sistemas de almacenamiento RAID. El resultado de sus investigaciones ha constituido la base de los complejos sistemas de almacenamiento RAID que existen en la actualidad. En la actualidad, IBM posee los derechos de propiedad intelectual sobre RAID 5.
El diseño del sistema de almacenamiento RAID tenía como objetivo mejorar el rendimiento, la recuperación, la fiabilidad y la escalabilidad del almacenamiento. El resultado fue un concepto de redundancia único que ofrece capacidades de recuperación de datos en caso de que falle una unidad del sistema. De hecho, las tarjetas controladoras RAID han adquirido la capacidad de seguir leyendo y escribiendo datos aunque un disco esté "desconectado".
Los diferentes tipos de RAID
Ontrack ofrece servicios de recuperación de datos para las principales arquitecturas RAID. Esto incluye, niveles RAID 0, 00, 1, 10, 1E, 1E0, 2, 3, 4, 5, 50, 5E, 5EE, 6 y 60. También recuperamos de un gran número de matrices RAID propietarias.
El desarrollo continuo de nuestras herramientas de software garantiza que utilicemos las técnicas más avanzadas y patentadas para lograr la mejor recuperación de datos posible. Además, el equipo de investigación & desarrollo asiste a nuestros ingenieros en la recuperación de datos cuando se enfrentan a matrices RAID propietarias inusuales, a través de herramientas personalizadas creadas especialmente para la ocasión.
Estamos recomendados por nuestros clientes.
Nos recomiendan la mayoría de los proveedores de RAID, como HP, Dell, Adaptec, IBM, Intel, Promise, EMC, NetApp y LSI Logic.
Configuración de RAID, incluida la configuración de la configuración de la red.
La configuración RAID, incluido el número de discos utilizados, determina el tipo. Como recordatorio, RAID significa Redundant Array of Independent Disks (matriz redundante de discos independientes) y es una solución de almacenamiento que distribuye los datos entre varios discos pequeños que juntos forman un único sistema. Además de ser menos costoso, este dispositivo tiene un alto nivel de rendimiento y seguridad de los datos, ya que RAID tolera mejor las averías.
Distribución redundante de discos independientes.
Hoy en día, existen casi veinte tipos de RAID, si no más, incluyendo configuraciones a veces consideradas obsoletas- entre las que se encuentra el RAID 2. De todas estas configuraciones RAID, las más comunes son RAID 0, RAID 1, RAID 10, RAID 5 o RAID 6.
RAID 0 utiliza dos o más discos y proporciona un acceso rápido a los datos pero sin redundancia. RAID 1 también utiliza dos discos pero escribe información duplicada en cada unidad. Si uno de los discos se daña, encontrará sus datos en el otro. Para beneficiarse del rendimiento del RAID 0 y de la seguridad que ofrece el RAID 1, se creó el RAID 5. Con una buena distribución de los datos, el RAID 5 combina velocidad y tolerancia a fallos. El RAID 6 tiene las mismas ventajas que el RAID 5, pero con la ventaja añadida de tolerar dos fallos de unidad en lugar de uno.
RAID 0
|
RAID 0 es la configuración clásica de extracción de datos, en la que los datos se escriben en todas las unidades, lo que permite un acceso más rápido. Sin embargo, este rendimiento conlleva un riesgo, si uno o más discos causan un desastre en un RAID 0, entonces se puede producir una grave pérdida de datos.
Un ejemplo de una situación de recuperación de datos: se creó un archivo que ocupaba las franjas de datos 1 - 4, si la unidad 2 fallara y se perdiera la 2ª franja, lo más probable es que el archivo se corrompiera. Otra forma de verlo sería si falla una unidad, el archivo bueno más grande posible tendría que ser menor que el tamaño combinado de las franjas restantes.
|
RAID 1
|
Este es el nivel RAID que configura la duplicación de discos; los datos del disco principal se duplican en el otro. No hay ganancias de rendimiento para este RAID, pero si una unidad falla, entonces usted tendrá una copia de seguridad en el segundo.
|
RAID 2
|
RAID 2 consiste en la separación de datos a nivel de bits con una unidad de paridad dedicada. Este nivel utiliza códigos de detección de errores hamming y está pensado para su uso en unidades que no tienen detección de errores integrada. Por esta razón, RAID 2 ya no se utiliza habitualmente.
|
RAID 3 y 4
|
RAID 3 y 4 utilizan la división en franjas con una unidad de paridad dedicada. La diferencia entre ambos es que RAID 3 divide en franjas a nivel de bytes, mientras que RAID 4 divide en franjas a nivel de bloques. El RAID 3 se utiliza muy poco hoy en día debido al bajo rendimiento de la división en bandas a nivel de bytes, mientras que el RAID 4 es mejor con la división en bandas a nivel de bloques, pero sigue teniendo un rendimiento de escritura más lento debido a que la paridad tiene que actualizarse en cada escritura.
|
RAID 5
|
En general, se considera que RAID 5 es el mejor compromiso entre tolerancia a fallos, velocidad y coste. El sistema divide los datos de la misma forma que un RAID 0, pero también distribuye los datos de paridad en todos los discos duros que lo componen. Cada proveedor tiene su forma específica de distribuir la información de paridad en los discos, pero casi siempre será una de estas cuatro formas: asimétrica izquierda, simétrica izquierda, asimétrica derecha y simétrica derecha.
El sentido de la paridad es el mismo que el de la paridad.
La dirección de la paridad es sencilla de identificar, como podéis ver se "mueve" tanto a derecha como a izquierda. En los RAID asimétricos las tiras de datos ignoran la paridad, se la saltan hasta llegar al siguiente espacio disponible. Los RAIDs simétricos manejan las tiras de datos de una forma un poco más compleja, una vez que los datos se encuentran con un bloque de paridad, se mueven hacia los lados y hacia abajo hasta el siguiente conjunto de tiras.
|
|
RAID 6
|
El sistema RAID 6 es una extensión del RAID 5: realiza la misma distribución de datos y adopta una división similar de la paridad, pero genera un bloque de datos adicional para cada franja. De esta forma, aunque dos discos fallaran simultáneamente, el RAID no sufriría pérdida de datos. En los RAID más pequeños, la posibilidad de que dos discos duros fallen simultáneamente se reduce, pero a medida que aumenta el tamaño de la matriz RAID, la probabilidad de fallos aumenta.
En lo que respecta al rendimiento, el RAID se basa en una distribución de paridad similar, pero genera un bloque de datos adicional por cada franja.
En cuanto al rendimiento, son muy similares a los del RAID 5: la velocidad de escritura es alta, porque los bloques de datos y de paridad se pueden escribir en todos los discos, pero el acceso de lectura es lento debido al retardo generado por el salto de dos series de paridad.
|
|
RAID 0+1 y 1+0
|
Para ganar rendimiento y/o redundancia adicional, los niveles RAID estándar pueden combinarse para crear niveles RAID híbridos o anidados; los tipos de RAID que proporcionan redundancia suelen combinarse con RAID 0 para aumentar el rendimiento.
La ventaja es que cuando un nivel RAID se combina con un nivel RAID 0, el rendimiento es mayor.
La ventaja es que cuando falla una unidad en una de las matrices de nivel 0, los datos que faltan pueden transferirse desde la otra matriz. Sin embargo, la adición de un disco duro adicional a una franja, requiere que añada un disco duro adicional a las otras franjas para equilibrar el almacenamiento entre las matrices.
La ventaja es que cuando falla una unidad en una de las matrices de nivel 0, los datos que faltan pueden transferirse desde la otra matriz.
Una desventaja de esta configuración es que no puede recuperarse de dos fallos de unidad simultáneos, a menos que las unidades sean de la misma banda de datos. En el diagrama; si las unidades 1 y 5 fallasen, el RAID podría reconstruirse, pero si fallasen la 1 y la 4, se produciría una pérdida de datos.
|
|
RAID 10
|
RAID 10 está configurado de forma que el RAID 0 se divide en dos matrices RAID 1.
La gran ventaja de RAID 10 es que puede dividirse en dos matrices.
Una gran ventaja del RAID 10 es que todas las unidades menos una de cada matriz RAID 1 pueden fallar sin pérdida de datos. Sin embargo, si la unidad que ha fallado no se sustituye, la única unidad que funciona en esa matriz se convierte en un único punto de fallo para todo el sistema; si esa última unidad falla, se pierden todos los datos de la matriz.
La anidación de RAID en una matriz RAID 10 es una de las principales ventajas.
La técnica de anidamiento RAID también se puede utilizar para otros niveles RAID, más comúnmente en RAID 5 pero también se puede aplicar a otros niveles como 3 y 6, produciendo niveles como 50, 51, 60, 61, 30 y 03.
|
|
RAID 50
|
RAID 50, también llamado RAID 5+0, combina la división en bandas a nivel de bloque del RAID 0 con la paridad distribuida del RAID 5. Como una matriz RAID 0 dividida en elementos RAID 5, la configuración RAID 50 mínima requiere seis unidades. Una unidad de cada uno de los conjuntos RAID 5 podría fallar sin pérdida de datos; por ejemplo, una configuración RAID 50 que incluya tres conjuntos RAID 5 puede tolerar un máximo de tres posibles fallos simultáneos de unidad (pero sólo uno por conjunto RAID 5). Dado que la fiabilidad del sistema depende de la rápida sustitución de la unidad defectuosa para que la matriz pueda reconstruirse, es habitual incluir repuestos en caliente que puedan empezar a reconstruir la matriz inmediatamente después del fallo.
|
|
RAID 51
|
RAID 51 se implementa reflejando o implementando RAID 1 en una matriz RAID 5 completa además de la información de paridad. Generalmente se crea utilizando técnicas RAID basadas en software y hardware, donde la duplicación basada en RAID 1 se implementa a través de un sistema operativo en la matriz RAID 5 basada en hardware. RAID 51 se ha diseñado específicamente para mejorar la disponibilidad de las copias de seguridad y ofrecer una alta tolerancia a fallos. RAID 51 se considera un conjunto de discos en espejo con paridad, de ahí que a RAID 5 le siga RAID 1. Puede permanecer operativo o proteger de la pérdida de datos incluso después de perder cuatro de los seis discos configurados como mínimo.
|
|
Vocabulario comúnmente utilizado sobre RAID
RAID: RAID es una tecnología que admite el uso de 2 o más discos duros en varias configuraciones con el fin de lograr un mayor rendimiento, fiabilidad y tamaños de volumen más grandes mediante el uso de la consolidación de recursos de disco y cálculos de paridad.
Paridad: Cálculo matemático que permite que los discos de una matriz RAID fallen sin pérdida de datos. La forma más sencilla de mostrar esto es la ecuación: A + B = C. Puede eliminar cualquiera de las letras anteriores y calcular su valor a partir de las 2 restantes. Por ejemplo, si se quita B para que la ecuación sea A + B = C, entonces el valor de B se puede calcular moviendo la A, por lo que B = C - A. Esta es obviamente una forma simplista de describirlo, para entenderlo completamente en un sentido RAID, se requieren conocimientos de binario y la expresión lógica XOR.
Mirroring: Los datos de 1 o más discos duros se duplican en otro(s) disco(s) físico(s).
Striping: El método que permite escribir datos y paridad en varios discos. Los datos se escriben a través de las unidades en un orden secuencial hasta la última unidad, entonces salta de nuevo a la primera y comienza una segunda franja.
Bloque: Un bloque es el espacio lógico en cada disco donde se escriben los datos, la cantidad de espacio la establece la controladora RAID y lo más habitual es que tenga un tamaño de 16KB a 256KB. Los datos llenarán el espacio hasta alcanzar el límite y entonces pasarán a la siguiente unidad, hasta la última unidad en la que saltarán al inicio de la siguiente franja.
Simetría izquierda/derecha: La simetría en un RAID controla cómo se distribuyen los datos y la paridad entre las unidades. Hay cuatro estilos principales de simetría, el que se utiliza depende del vendedor de RAID. Algunas empresas también fabrican estilos propios en función de sus necesidades empresariales.
Hot Spare: Hay varios métodos diferentes para tratar los fallos de disco dentro de un RAID, uno de ellos es el uso de un Hot Spare. Se trata de un disco de repuesto que se puede utilizar en lugar del que ha fallado.
Modo degradado: Esto ocurre cuando una unidad del RAID se vuelve ilegible, la unidad se considera defectuosa y se retira del RAID. Los nuevos datos y la paridad se escriben en el resto de las unidades del RAID y, si se solicita algún dato de la unidad averiada, se procesa con la paridad de las demás. Esto degrada el rendimiento del RAID, de ahí el modo degradado.