O Que é o RAID e Por Que é Importante para os Servidores

O que é o RAID
RAID significa Redundant Array of Independent Disks (Conjunto Redundante de Discos Independentes). O RAID é uma tecnologia que combina vários discos físicos numa única unidade lógica para melhorar o desempenho, aumentar a capacidade ou proporcionar redundância de dados, ou uma combinação destes objetivos. O RAID é uma tecnologia fundamental para os servidores, porque garante um funcionamento contínuo mesmo quando um ou mais discos falham, algo de extrema importância em ambientes de alojamento, porque o tempo de inatividade significa perda de receitas e de reputação.
O conceito de RAID remonta a 1988, quando investigadores da UC Berkeley propuseram usar vários discos baratos em vez de um disco caro para melhorar a fiabilidade e o desempenho. Desde então, o RAID evoluiu e é hoje o padrão na infraestrutura de servidores. Compreender os níveis de RAID é importante para quem gere um servidor ou escolhe um alojamento, porque afeta diretamente a segurança dos dados e o desempenho.
RAID 0 - Striping
Como funciona
O RAID 0 distribui os dados de forma uniforme por dois ou mais discos sem qualquer redundância. Quando um ficheiro é gravado, os dados são divididos em blocos gravados alternadamente em discos diferentes. Este processo chama-se striping, porque os dados são espalhados em faixas (stripes) por todos os discos do conjunto. Por exemplo, um ficheiro de 100 MB em dois discos seria dividido de forma a que o primeiro disco armazenasse os blocos 1, 3, 5 e o segundo armazenasse os blocos 2, 4, 6, conseguindo leitura e escrita em paralelo.
Vantagens e desvantagens
A principal vantagem do RAID 0 é um desempenho significativamente melhorado, porque as operações de leitura e escrita são distribuídas por vários discos em simultâneo. Dois discos em RAID 0 oferecem, em teoria, o dobro da velocidade de leitura e escrita em comparação com um único disco. A capacidade total é a soma de todos os discos, pelo que dois discos de 1 TB dão 2 TB de espaço utilizável. No entanto, o RAID 0 não tem redundância, o que significa que, se qualquer disco falhar, todos os dados são perdidos de forma irrecuperável. Na verdade, a fiabilidade do RAID 0 é inferior à de um único disco, porque a falha de qualquer disco do conjunto destrói todos os dados. Por esta razão, o RAID 0 nunca é usado em servidores de produção ou em alojamento, porque o risco de perda de dados é inaceitável.
RAID 1 - Mirroring
Como funciona
O RAID 1 cria uma cópia idêntica dos dados em dois ou mais discos, num processo chamado mirroring (espelhamento). Cada porção de dados gravada no primeiro disco é gravada em simultâneo no segundo disco. Se um disco falhar, o outro contém uma cópia completa de todos os dados e o sistema continua a funcionar sem interrupção. Quando o disco avariado é substituído por um novo, o sistema reconstrói automaticamente a cópia dos dados no novo disco, num processo chamado rebuild.
Vantagens e desvantagens
O RAID 1 proporciona uma excelente redundância, porque o sistema consegue sobreviver à falha de um disco sem perda de dados e sem interrupção. O desempenho de leitura é melhorado, porque os dados podem ser lidos a partir dos dois discos em simultâneo, mas o desempenho de escrita é igual ou ligeiramente inferior ao de um único disco, porque cada porção de dados tem de ser gravada duas vezes. A principal desvantagem é a perda de capacidade, porque apenas metade da capacidade total dos discos é utilizada. Dois discos de 1 TB em RAID 1 dão apenas 1 TB de espaço utilizável. O RAID 1 é uma excelente escolha para os discos de sistema dos servidores e para configurações mais pequenas em que a redundância é uma prioridade.
RAID 5 - Striping com paridade
Como funciona
O RAID 5 combina o striping com paridade distribuída e requer um mínimo de três discos. Os dados são divididos em blocos e distribuídos por todos os discos do conjunto, juntamente com a informação de paridade. A paridade é um bloco calculado matematicamente que permite reconstruir os dados se um disco falhar. Os blocos de paridade são distribuídos uniformemente por todos os discos em vez de estarem concentrados num só disco, eliminando o estrangulamento de escrita. Quando um disco falha, o sistema usa os restantes dados e a informação de paridade para reconstruir os dados perdidos.
Vantagens e desvantagens
O RAID 5 oferece um bom equilíbrio entre desempenho, capacidade e redundância. A capacidade utilizável é de N menos 1 discos, em que N é o número total de discos, pelo que cinco discos de 1 TB proporcionam 4 TB de espaço utilizável, ficando 1 TB de espaço ocupado pela paridade. O desempenho de leitura é excelente, porque os dados são lidos de vários discos em paralelo. O sistema consegue sobreviver à falha de um disco, mas não de dois, porque a perda de um segundo disco antes de o processo de rebuild estar concluído resultaria na perda de todos os dados. O processo de rebuild em discos grandes pode demorar horas ou mesmo dias, período durante o qual o conjunto fica vulnerável. É por isso que o RAID 5 é considerado menos seguro para discos grandes de capacidade moderna.
RAID 6 - Striping com paridade dupla
Como funciona
O RAID 6 é uma extensão do RAID 5 que usa dois blocos de paridade independentes em vez de um e requer um mínimo de quatro discos. Dois algoritmos diferentes de cálculo de paridade garantem que o sistema consegue sobreviver à falha simultânea de dois discos sem perda de dados. Trata-se de uma melhoria significativa em relação ao RAID 5, porque elimina a vulnerabilidade durante o processo de rebuild. Se um disco falhar e um segundo disco falhar antes de o rebuild terminar, os dados continuam seguros, porque os dois blocos de paridade permitem a reconstrução.
Vantagens e desvantagens
O RAID 6 proporciona o nível mais elevado de redundância entre os níveis de RAID padrão, com a capacidade de sobreviver à falha de dois discos em simultâneo. A capacidade utilizável é de N menos 2 discos, pelo que seis discos de 1 TB proporcionam 4 TB de espaço utilizável. O desempenho de leitura é semelhante ao do RAID 5, mas o desempenho de escrita é inferior, porque é preciso calcular e gravar dois blocos de paridade em cada operação de escrita. O RAID 6 é recomendado para conjuntos grandes com discos de grande capacidade, onde a probabilidade de falha de um segundo disco durante o rebuild é significativa e onde a perda de dados é inaceitável.
RAID 10 - Combinação de mirroring e striping
Como funciona
O RAID 10 combina o mirroring do RAID 1 e o striping do RAID 0, exigindo um mínimo de quatro discos. Os discos são primeiro combinados em pares que se espelham como RAID 1, e depois esses pares são combinados num stripe RAID 0. Por exemplo, com quatro discos, os discos 1 e 2 espelham-se e os discos 3 e 4 espelham-se, com os dados distribuídos em striping entre estes dois espelhos. Isto significa que cada porção de dados existe em duas cópias em discos diferentes e que as operações de leitura e escrita são paralelizadas.
Vantagens e desvantagens
O RAID 10 oferece o melhor desempenho de todos os níveis de RAID com redundância, porque combina a velocidade do striping com a segurança do mirroring. O desempenho de leitura e escrita é excelente, porque as operações são distribuídas por vários discos. O sistema consegue sobreviver à falha de um disco em cada par espelhado sem perda de dados. O rebuild é rápido, porque apenas o conteúdo de um disco é copiado, em vez da reconstrução por paridade. A principal desvantagem é a perda de metade da capacidade, tal como no RAID 1, pelo que quatro discos de 1 TB proporcionam 2 TB de espaço utilizável. O RAID 10 é preferido para bases de dados e aplicações com escrita intensiva, onde o desempenho é crítico.
O RAID no contexto do alojamento
Como os fornecedores de alojamento usam o RAID
Os fornecedores de alojamento profissionais usam RAID em todos os servidores para garantir fiabilidade e desempenho. Os servidores de alojamento web usam normalmente RAID 1 para os discos de sistema e RAID 5 ou RAID 6 para os discos de armazenamento com dados dos utilizadores. Os servidores de bases de dados preferem o RAID 10 devido ao desempenho de escrita superior. O alojamento moderno com discos SSD melhora ainda mais o desempenho, porque os SSD têm um tempo de acesso muito mais rápido e um débito mais elevado do que os discos mecânicos.
O RAID não substitui o backup
É fundamental compreender que o RAID não é um backup. O RAID protege contra a falha de hardware dos discos, mas não protege contra a eliminação acidental de ficheiros, a corrupção de dados, ataques de vírus, bugs de software ou desastres como incêndios ou inundações. Se eliminar um ficheiro por engano, o RAID elimina diligentemente a cópia em todos os discos do conjunto. Se um ransomware encriptar os dados, o RAID encripta as cópias em todos os discos. É por isso que o backup regular para um local separado é essencial, independentemente da configuração RAID. A estratégia ideal é RAID para alta disponibilidade mais backup para proteção contra perda de dados.
RAID por hardware vs por software
O RAID por hardware usa um controlador RAID dedicado, com o seu próprio processador e memória, para gerir o conjunto de discos. As vantagens são um melhor desempenho, porque as operações de RAID não sobrecarregam o processador principal do servidor, o suporte para funcionalidades avançadas como a substituição de discos em hot-swap sem desligar o sistema, e uma cache de escrita com bateria de apoio que protege os dados em caso de falha de energia. O RAID por software usa o processador e o sistema operativo para gerir o RAID, o que é uma opção mais barata mas com menor desempenho. O mdadm do Linux é uma ferramenta popular de RAID por software. Para servidores de alojamento, recomenda-se o RAID por hardware, porque proporciona um desempenho mais fiável sob carga.
Conclusão
A tecnologia RAID é a base de um servidor de alojamento fiável, que garante que a falha de um ou mais discos não conduz à perda de dados nem à interrupção do serviço. O RAID 1 é ideal para configurações mais pequenas com dois discos, o RAID 5 oferece um bom equilíbrio para conjuntos médios, o RAID 6 proporciona segurança adicional para conjuntos grandes e o RAID 10 oferece o melhor desempenho com redundância para aplicações exigentes. Na BeoHosting, todos os nossos servidores usam configurações RAID com discos SSD e backups regulares, garantindo a máxima fiabilidade, velocidade e segurança dos dados para o seu site.
BeoHosting Team
10+ anos de experiência — Especialistas em alojamento web e infraestrutura
- Web Hosting
- WordPress Hosting
- VPS
- Dedicated Serveri
- Domeni
- SSL
- cPanel
- LiteSpeed
- Linux administracija
- DNS
Última atualização: