Falha da Amazon provocada por tempestade mas piorada por «bugs nunca vistos»
Apesar de terem sido as fortes tempestades a provocar a interrupção nos serviços da Amazon, a empresa explica que a longa duração do período em que esteve indisponível se deveu a uma série de «bugs nunca vistos» antes.
Segundo a retalhista online, a cloud da Amazon na região Este dos EUA (10 centros de informação divididos por quatro zonas de disponibilidade) sofreu inicialmente perturbações por flutuações de energia, provavelmente causadas pelas tempestades.
A «queda» dos serviços levou à danificação de tecnologias chave como a EC2. No entanto, foi devido a uma série de «bugs nunca vistos» que o período de indisponibilidade durou tanto tempo.
Um dos centros de informação falhou na tarefa de mudar para o gerador de reserva, e eventualmente a energia armazenada na sua alimentação ininterrupta de energia (UPS, na sigla em inglês) foi esgotada, o que levou ao encerramento do hardware na região.
Este conjunto de impedimentos causou «um impacto significativo nos clientes», refere a gigante multimédia, sublinhando que a situação piorou com a degradação dos «control planes», software que permite aos utilizadores criar, remover e modificar fontes espalhadas pela região.
Os problemas agravaram-se ainda mais já que, quando a Amazon tem que restabelecer tecnologias chave como a EC2 e a EBS, tem que proceder a um conjunto de operações técnicas, e a empresa terá encontrado problemas no sistema de «boot» do servidor.
Quando componentes chave AWS, como o EC2, vão abaixo, o sistema ELB tenta distribuir cargas pelos servidores com espaço. Contudo, quando a cloud da Amazon foi reiniciada, «um grande número de ELBs surgiu num estado que causou bugs que nunca tínhamos visto».




CONSULTE OS NOSSOS CANAIS |
|
|
|
|
Ficha Técnica | Estatuto editorial | Contactos