Informações contextuais sobre RAID

Written By: Ontrack

Date Published: Agosto 09, 2023

Informações contextuais sobre RAID

O que é o RAID?

O armazenamento Redundant Array of Independent (originalmente, Inexpensive) Disks (RAID) revolucionou a tecnologia de armazenamento de dados empresariais, contribuindo para a tranquilidade oferecida pela redundância (a partir do RAID 1 e superior), que poderá minimizar em grande medida o tempo de inatividade sofrido devido a falhas de unidades individuais.

Infelizmente, o armazenamento RAID não é uma tecnologia perfeita e, por isso, continua a ser possível ocorrer uma perda de dados.

A definição de RAID está no próprio nome do sistema. RAID significa matriz redundante de discos independentes (em inglês, Redundant Array of Independent Disks), ou seja, trata-se literalmente de um conjunto redundante de discos independentes, um cluster de múltiplos discos rígidos para obter uma única partição lógica. Consoante a finalidade, o RAID aumenta o desempenho do acesso e da escrita de dados, ao mesmo tempo que melhora a segurança das informações.

A tecnologia RAID suporta a utilização de 2 ou mais discos rígidos em várias configurações com o objetivo de melhorar o desempenho e a fiabilidade, e obter maiores tamanhos de volume através da consolidação de recursos de discos e cálculos de paridade.

Foram concebidas várias configurações padrão denominadas níveis. Originalmente, foram criados cinco níveis RAID, mas surgiram muito mais variações, nomeadamente vários níveis aninhados e muitos níveis não padrão (na sua maioria, proprietários).

Então, o que representam os níveis RAID? Os números referem-se simplesmente à configuração do RAID. Sabendo que todos os sistemas RAID armazenam dados de forma eficiente, a escolha do sistema irá basear-se nas suas próprias necessidades pessoais. O RAID 1, por exemplo, vai ao encontro das necessidades de desempenho e fiabilidade. O RAID 5 é uma boa escolha se procura tanto desempenho como tolerância a falhas.

what-is-raid

Visão geral do sistema RAID

RAID é um termo utilizado para os esquemas de armazenamento de dados informáticos que distribuem e/ou replicam os dados por múltiplas unidades de disco rígido. A tecnologia RAID foi concebida com dois objetivos principais: aumentar a fiabilidade dos dados e aumentar o desempenho de E/S (entrada/saída).

Um RAID combina discos rígidos físicos numa única unidade lógica através de hardware ou de software especial. As soluções RAID de hardware podem ter vários estilos, desde integrados na placa de sistema ou placas adicionais, até grandes servidores NAS ou SAN empresariais. Com estas configurações, o sistema operativo desconhece o funcionamento técnico ou o RAID. Normalmente, as soluções de software são implementadas no sistema operativo.

Existem três conceitos chave no RAID:

  • espelhamento, a cópia de dados em mais de um disco
  • repartição, a divisão de dados por mais de um disco
  • correção de erros, onde são armazenados dados redundantes para permitir a deteção dos problemas e, possivelmente, a sua correção (conhecida como tolerância a falhas)

Os diferentes níveis RAID utilizam uma ou mais destas técnicas, consoante os requisitos do sistema.

Tradicionalmente, o RAID é utilizado em servidores, mas também pode ser utilizado em estações de trabalho. Este último é especialmente relevante nos computadores com utilização intensiva de armazenamento, como os que são usados para edição de vídeo e áudio.

raid-recovery-tips

Histórico do sistema RAID

RAID é o acrónimo de Redundant Array of Inexpensive Disks (posteriormente, Redundant Array of Independent Disks). O conceito nasceu na Universidade da Califórnia, Berkeley, onde David A. Patterson, Garth Gibson e Randy H. Katz colaboraram na produção de protótipos operacionais dos cinco níveis de sistemas de armazenamento RAID. O resultado da sua investigação formou a base dos complexos sistemas de armazenamento RAID que existem atualmente. Atualmente, a IBM detém os direitos de propriedade intelectual do RAID 5.

A conceção do sistema de armazenamento RAID visava melhorar o desempenho, a recuperação, a fiabilidade e a escalabilidade do armazenamento. O resultado foi um conceito de redundância único que oferece capacidades de recuperação de dados no caso de falha de uma unidade no sistema. De facto, as placas controladoras RAID adquiriram a capacidade de continuar a ler e a escrever dados, mesmo quando um disco está "offline".

Os diferentes tipos de RAID

A Ontrack oferece serviços de recuperação de dados para todas as principais arquiteturas RAID. Isto inclui os níveis RAID 0, 00, 1, 10, 1E, 1E0, 2, 3, 4, 5, 50, 5E, 5EE, 6 e 60. Também recuperamos de uma grande quantidade de matrizes RAID proprietárias.

O desenvolvimento contínuo das nossas ferramentas de software assegura que utilizamos as mais recentes técnicas proprietárias e de última geração para obter a melhor recuperação de dados possível. Além disso, a equipa de investigação e desenvolvimento ajuda os nossos engenheiros na recuperação de dados quando são confrontados com matrizes RAID proprietárias pouco comuns, através de ferramentas personalizadas criadas especialmente para a ocasião.

Somos recomendados pela maioria dos fornecedores RAID, como a HP, Dell, Adaptec, IBM, Intel, Promise, EMC, NetApp e LSI Logic.

A configuração RAID, incluindo o número de discos utilizados, determina o tipo. Recorde-se que RAID significa matriz redundante de discos independentes e é uma solução de armazenamento que distribui os dados por vários discos pequenos que, juntos, formam um único sistema. Além de ser mais barato, este dispositivo tem um alto nível de desempenho e segurança de dados, uma vez que o RAID tolera melhor as falhas.

Atualmente, existem quase vinte tipos de RAID, se não mais, incluindo configurações por vezes consideradas obsoletas, entre as quais está o RAID 2. De todas estas configurações RAID, as mais comuns são RAID 0, RAID 1, RAID 10, RAID 5 ou RAID 6.

RAID 0 utiliza dois ou mais discos e fornece acesso rápido aos dados, mas sem redundância. RAID 1 também utiliza dois discos, mas escreve informações duplicadas em cada unidade. Se um dos discos estiver danificado, encontrará os seus dados no outro. Para tirar partido do desempenho do RAID 0 e da segurança oferecida pelo RAID 1, foi criado o RAID 5. Com uma boa distribuição de dados, o RAID 5 alia a velocidade à tolerância a falhas. O RAID 6 tem as mesmas vantagens do RAID 5, mas com a vantagem adicional de tolerar duas falhas de unidade, em vez de uma.

 

RAID 0

RAID 0 é a configuração clássica de repartição de dados, em que os dados são escritos em todas as unidades, o que resulta num acesso mais rápido. No entanto, este desempenho comporta um risco: caso um ou mais discos causem um desastre num RAID 0, poderá ocorrer uma perda de dados grave.

Um exemplo de situação de recuperação de dados: foi criado um ficheiro que ocupava as faixas de dados 1 a 4; se a unidade 2 falhasse e a segunda faixa se perdesse, o ficheiro provavelmente ficaria danificado. Outra forma de olhar para isto seria, caso uma unidade falhasse, o maior ficheiro possível em bom estado teria de ser menor do que o tamanho combinado das faixas restantes.

RAID 1

Este é o nível de RAID que configura o espelhamento do disco; os dados no disco primário são duplicados no outro. Não há ganhos de desempenho para este RAID, mas se uma unidade falhar, terá um cópia de segurança no segundo.

RAID 2

O RAID 2 é composto por uma repartição de dados a nível do bit com uma unidade de paridade dedicada. Este nível utiliza códigos de deteção de erros de hamming e destina-se a unidades sem deteção de erros integrada. Por esta razão, já não é costume utilizar o RAID 2.

RAID 3 and 4

 

Tanto o RAID 3 como 4 utilizam faixas com uma unidade de paridade dedicada, a diferença entre os dois é que o RAID 3 reparte a faixa a nível do byte, enquanto o RAID 4 reparte a nível do bloco. O RAID 3 é pouco utilizado atualmente dado o fraco desempenho da repartição a nível do byte; o RAID 4 é melhor com a repartição a nível do bloco, mas ainda sofre de um desempenho de escrita mais lento, devido a ser necessário atualizar a paridade em cada escrita.

RAID 5

Normalmente, o RAID 5 é considerado o melhor compromisso entre a tolerância a falhas, a velocidade e o custo. O sistema divide os dados como um RAID 0, mas também distribui os dados da paridade por todos os discos rígidos que o compõem. Cada fabricante tem uma forma específica de distribuir as informações de paridade nos discos, mas será quase sempre uma das seguintes formas: esquerda assimétrica, esquerda simétrica, direita assimétrica e direita simétrica.

É simples identificar a direção da paridade; como podemos constatar, "move-se" tanto para a direita como para a esquerda. Nos RAIDs assimétricos, as partições de dados ignoram a paridade até atingirem o espaço disponível seguinte. Os RAIDs simétricos processam faixas de dados de uma forma um pouco mais complexa: assim que os dados encontram um bloco de paridade, movem-se lateralmente e verticalmente para o conjunto de faixas seguinte.

RAID 6

O sistema RAID 6 é uma extensão do RAID 5: executa a mesma distribuição de dados e adota uma divisão semelhante de paridade, mas gera um bloco de dados adicional para cada faixa. Assim, mesmo que dois discos falhassem em simultâneo, o RAID não sofreria uma perda de dados. Em RAIDs mais pequenos, a possibilidade de dois discos rígidos falharem em simultâneo é reduzida, mas à medida que a matriz RAID aumenta, aumenta a probabilidade de ocorrerem falhas.

Quanto ao desempenho, é muito semelhante ao do RAID 5: a velocidade de escrita é elevada, visto que os blocos de dados e paridade podem ser escritos em todos os discos, mas o acesso de leitura é lento devido ao atraso gerado pelo salto de duas séries de paridades.

RAID 0+1 and 1+0

Para obter desempenho e/ou redundância adicional, os níveis de RAID padrão podem ser combinados para criar níveis de RAID híbridos ou aninhados; os tipos de RAID que fornecem redundância são normalmente combinados com RAID 0 para aumentar o desempenho.

A vantagem é que quando uma unidade falha numa das matrizes de nível 0, os dados em falta podem ser transferidos a partir da outra matriz. No entanto, ao adicionar mais um disco rígido a uma faixa é necessário adicionar mais um disco rígido às outras partições para equilibrar o armazenamento entre as matrizes.

Uma desvantagem desta configuração é a impossibilidade de recuperar de duas falhas de unidade simultâneas, a menos que as unidades pertençam à mesma faixa de dados. No diagrama, se as unidades 1 e 5 falhassem, o RAID poderia ser recompilado, mas se as unidades 1 e 4 falhassem, ocorreria uma perda de dados.

RAID 10

O RAID 10 é configurado de modo a que o RAID 0 seja dividido por duas matrizes RAID 1.

Uma grande vantagem do RAID 10 é a de todas as unidades, exceto uma unidade de cada matriz RAID 1, poderem falhar sem perda de dados. No entanto, se a unidade com falha não for substituída, a única unidade a funcionar nessa matriz torna-se num único ponto de falha para todo o sistema; se a última unidade for perdida, todos os dados dentro da matriz serão perdidos.

A técnica de aninhamento do RAID também pode ser utilizada para outros níveis de RAID, mais frequentemente no RAID 5, mas também pode ser aplicada a outros níveis, como o 3 e o 6, produzindo níveis como 50, 51, 60, 61, 30 e 03.

RAID 50

 

O RAID 50, também denominado RAID 5+0, combina a repartição direta a nível de bloco do RAID 0 com a paridade distribuída do RAID 5. Como uma matriz RAID 0 repartida por elementos RAID 5, a configuração RAID 50 mínima necessita de seis unidades. Uma unidade de cada um dos conjuntos RAID 5 pode falhar sem perda de dados; por exemplo, uma configuração RAID 50 que inclua três conjuntos RAID 5 pode tolerar três falhas de unidade simultâneas de máximo potencial (mas apenas uma por conjunto RAID 5). Como a fiabilidade do sistema depende da rápida substituição da unidade danificada para ser possível recompilar a matriz, é comum incluir peças sobressalentes dinâmicas que possam começar imediatamente a recompilar a matriz em caso de falha.

RAID 51

 

O RAID 51 é implementado ao espelhar ou implementar o RAID 1 numa matriz RAID 5 completa, além das informações de paridade. Normalmente, é criado através de técnicas RAID baseadas em software e hardware onde o espelhamento baseado em RAID 1 é implementado através de um sistema operativo na matriz RAID 5 baseada em hardware. O RAID 51 foi concebido especificamente para melhorar a disponibilidade das cópias de segurança e as capacidades de elevada tolerância a falhas. O RAID 51 é considerado um conjunto de paridade de discos espelhados, pelo que o RAID 5 é seguido pelo RAID 1. Pode permanecer operacional ou proteger contra a perda de dados, mesmo depois de perder quatro dos seis discos mínimos configurados.

 

Vocabulário RAID de uso comum

RAID: RAID é uma tecnologia que suporta a utilização de 2 ou mais discos rígidos em várias configurações com o objetivo de melhorar o desempenho e a fiabilidade, e obter maiores tamanhos de volume através da consolidação de recursos de discos e cálculos de paridade.

Paridade: um cálculo matemático que permite às unidades numa matriz RAID falhar sem a perda de dados. A forma mais simples de mostrar isto é a equação: A + B = C. Poderá remover qualquer uma das letras acima e calcular o seu valor a partir das 2 restantes. Ou seja, no caso da remoção de B e, assim, a equação A + ? = C, o valor de B poderá ser calculado ao mover o A, pelo que B = C – A. Obviamente, esta é uma forma simplista de o descrever. Para o compreender totalmente num sentido RAID, são necessários conhecimentos do sistema binário e de expressão lógica XOR.

Espelhamento: os dados de 1 ou mais discos rígidos são duplicados para outros discos físicos.

Repartição: o método em que os dados e a paridade podem ser escritos em vários discos. Os dados são escritos nas unidades numa ordem sequencial até à última unidade e, em seguida, volta-se ao início e começa-se uma segunda faixa.

Bloco: um bloco é o espaço lógico em cada disco em que os dados são escritos. A quantidade de espaço é definida pelo controlador RAID que normalmente tem um tamanho de 16 KB a 256 KB. Os dados preencherão o espaço até o limite ser atingido e, depois, passarão para a unidade seguinte, até chegarem à última unidade, quando voltam ao início e começam a faixa seguinte.

Simetria esquerda/direita: a simetria num RAID controla a forma como os dados e a paridade são distribuídos pelas unidades. Existem quatro estilos principais de simetria, cada um utilizado consoante o fornecedor RAID. Algumas empresas também criam estilos proprietários consoante as suas necessidades comerciais.

Hot Spare: existem alguns métodos diferentes para lidar com falhas de unidade num RAID, uma das quais é o recurso a um Hot Spare. Trata-se de um disco sobressalente que pode ser utilizado para substituir o que falhou.

Modo degradado: acontece quando uma unidade no RAID fica ilegível. A unidade é considerada danificada e é retirada do RAID. Os novos dados e a paridade são então escritos nas unidades restantes no RAID. Se forem solicitados dados da unidade com falhas, o problema é resolvido com a paridade nas outras unidades. Isto degrada o desempenho do RAID, daí o termo "modo degradado".

Subscrever

KLDiscovery Ontrack SL, Pº del Club Deportivo 1, edif. 4, 1ª planta, Pozuelo de Alarcón, Madrid, 28223, España (Mostrar todas las ubicaciones)