Como um erro de digitação temporariamente derrubou a Internet

Dependendo de onde você mora e de quais sites você visita, você deve ter notado a internet agindo na terça-feira. E agora sabemos como isso aconteceu ...

Dependendo de onde você mora e de quais sites você visita, você deve ter notado a internet agindo na terça-feira.  E agora sabemos como isso aconteceu ...
Propaganda

Dependendo de onde você mora e quais sites você visita Os Melhores Sites da Internet Os Melhores Sites da Internet Uma lista enorme dos melhores sites da Internet, em quatorze categorias úteis. Estes são considerados os melhores sites que vão te dar o que você precisa. Leia mais você pode ter notado a internet agindo na terça-feira (28 de fevereiro de 2017). Inúmeros sites foram interrompidos e milhões de pessoas foram afetadas. E agora, graças a Amazon admitindo a verdade, sabemos como isso aconteceu ...

De acordo com o pseudo intitulado “Resumo da interrupção do serviço Amazon S3 na região norte da Virgínia (EUA-EAST-1)” da Amazon, um único erro de digitação foi responsável por derrubar a Internet. E não, isso não é um erro de digitação. Um pequeno erro cometido por um engenheiro infeliz matou a internet por várias horas.

Você já tentou desligar e ligar?

Como explica a Amazon, às 9h37, um engenheiro da Amazon “executou um comando que tinha como objetivo remover um pequeno número de servidores de um dos subsistemas S3 usado pelo processo de faturamento do S3”. Até agora, tudo bem, já que esse membro da equipe estava fazendo exatamente o que foi pago para fazer.

“Infelizmente, uma das entradas para o comando foi inserida incorretamente e um conjunto maior de servidores foi removido do que o pretendido”. Esses servidores “suportavam outros dois subsistemas S3”, um dos quais “gerencia as informações de metadados e localização de todos os objetos S3 na região”. Que criou um problema sério.

A Amazon então tentou desligá-lo e ligá-lo novamente. Infelizmente, “o S3 tem experimentado um crescimento massivo nos últimos anos e o processo de reiniciar esses serviços e executar as verificações de segurança necessárias para validar a integridade dos metadados levou mais tempo do que o esperado”. Por isso, demorou até às 13:54 para que tudo voltasse a funcionar corretamente.

Para evitar um desempenho repetido, a Amazon está "fazendo várias alterações como resultado deste evento operacional". Isso inclui a introdução de “salvaguardas para evitar que a capacidade seja removida”, “auditar nossas outras ferramentas operacionais para garantir que tenhamos verificações de segurança semelhantes” e fazer “alterações para melhorar o tempo de recuperação dos principais subsistemas S3”.

Nós te dissemos sempre importa

Eu uma vez opinou que os erros sempre importam, mesmo online e em mensagens de texto Por que os erros sempre importam, mesmo online e em mensagens de texto [Opinião] Nós sempre cometemos erros de tempos em tempos . É natural, uma parte da vida, uma curva de aprendizado que usamos para melhorar a nós mesmos. Os erros de digitação não são exceção. Eles acontecem com frequência e, se escrever, forma ... Leia Mais. Este infeliz incidente certamente confirma isso, pois demonstra o impacto devastador que um erro de digitação solitário pode ter. OK, então não somos todos os engenheiros da Amazon encarregados de manter a internet funcionando, mas ainda assim, não há desculpa!

Você foi afetado pela paralisação da Amazônia na terça-feira? Quais sites você notou que agiram errado? Como você se sente sobre o fato de que um único erro de digitação derrubou a internet? O que a Amazon deve fazer para evitar um desempenho repetido? Por favor, deixe-nos saber nos comentários abaixo!

Crédito de imagem: Marco Verch via Flickr

In this article