A manhã de segunda-feira, 20 de outubro de 2025, começou com uma das maiores interrupções de serviços digitais dos últimos anos.
A Amazon Web Services (AWS), plataforma de computação em nuvem que sustenta aproximadamente 30% da infraestrutura global da internet, sofreu uma pane que afetou milhares de empresas e milhões de usuários ao redor do mundo. O incidente, que durou várias horas, revelou o quanto a nossa vida digital depende de poucos provedores de infraestrutura.
O problema começou por volta das 3h da manhã no horário da Costa Leste dos Estados Unidos. Nesse momento, a AWS identificou falhas em seu sistema DNS (Domain Name System). Para entender a gravidade da situação, é fundamental compreender o que é o DNS.
Este sistema funciona como uma espécie de lista telefônica da internet. Ele converte os nomes de domínio que digitamos nos navegadores, como www.amazon.com, em endereços IP numéricos que os computadores conseguem entender e processar.
Quando o DNS falha, os usuários não conseguem acessar os serviços. Isso acontece porque seus dispositivos não conseguem traduzir os endereços digitados em localizações reais na rede, mesmo que os servidores estejam funcionando perfeitamente. É como tentar ligar para alguém sem saber o número de telefone, mesmo tendo o nome da pessoa.
A Amazon informou que o problema estava relacionado a questões de resolução DNS da API do DynamoDB, seu banco de dados NoSQL. Isso acabou gerando um efeito cascata que afetou diversos outros serviços da companhia e recursos globais dependentes da infraestrutura nos Estados Unidos.
Embora a empresa tenha declarado que o problema foi “totalmente mitigado” algumas horas depois, os efeitos continuaram sendo sentidos ao longo do dia. Problemas de DNS podem levar tempo adicional para serem completamente resolvidos devido aos sistemas de cache espalhados pela internet.
Empresas e serviços afetados
A lista de serviços impactados pela falha demonstra o alcance da AWS na economia digital global. Entre os principais afetados estavam plataformas de pagamento como Venmo e Coinbase, redes sociais como Snapchat e Reddit, aplicativos de aprendizagem como Duolingo, jogos populares como Fortnite e Roblox. Além disso, serviços de videoconferência como Zoom também foram impactados.
Até mesmo produtos da própria Amazon ficaram indisponíveis durante o período. Entre eles estavam a Alexa, o Prime Video e o Ring. Segundo dados da Ookla, empresa especializada em monitoramento de rede, pelo menos mil empresas foram afetadas diretamente pela interrupção. Já o site Downdetector, que rastreia falhas em serviços online, registrou mais de 6,5 milhões de relatos de problemas durante o pico da interrupção.
Bancos como o Lloyds, plataformas de streaming como o Hulu e até mesmo o aplicativo do McDonald’s apresentaram instabilidades. No Brasil, diversos serviços também foram impactados. Especialmente aqueles de empresas multinacionais que utilizam a infraestrutura global da AWS. E-commerces, fintechs e plataformas de entretenimento relataram problemas de acesso e lentidão durante o período da manhã.
Como funciona a computação em nuvem
Para compreender por que uma falha na AWS pode derrubar tantos serviços simultaneamente, é necessário entender o conceito de computação em nuvem. Em vez de cada empresa manter seus próprios servidores físicos e infraestrutura de TI, elas alugam capacidade computacional de provedores especializados como a AWS.
Isso inclui desde o armazenamento de dados até o processamento de informações e a hospedagem de aplicações. A AWS opera através de uma rede global de data centers, organizados em regiões geográficas e zonas de disponibilidade. Cada região possui múltiplas zonas isoladas para garantir redundância e alta disponibilidade. Teoricamente, se uma zona falha, as outras continuam operando.
No entanto, quando o problema está em um componente fundamental como o DNS, que é compartilhado entre diferentes serviços, o impacto pode ser generalizado. As empresas escolhem a computação em nuvem por diversos motivos.
Entre eles estão a redução de custos com infraestrutura própria, a escalabilidade para crescer ou diminuir recursos conforme a demanda, o acesso a tecnologias avançadas sem grandes investimentos iniciais e a promessa de alta disponibilidade. Porém, como o incidente demonstrou, essa centralização também cria pontos únicos de falha que podem afetar a economia digital global.
O mercado de computação em nuvem
O mercado global de computação em nuvem é dominado por três gigantes tecnológicos. A AWS lidera com aproximadamente 30% a 33% de participação de mercado, seguida pela Microsoft Azure com 20% a 22% e pelo Google Cloud Platform com 12% a 13%.
Juntas, essas três empresas controlam mais de 65% de toda a infraestrutura de nuvem mundial. Trata-se de um mercado estimado em mais de 900 bilhões de dólares em 2025. A Amazon foi pioneira neste segmento, lançando a AWS em 2006 como uma forma de rentabilizar sua capacidade computacional excedente.
A Microsoft entrou no mercado em 2010 com o Azure, aproveitando sua base instalada de clientes corporativos. Já o Google Cloud, lançado em 2011, apostou em sua especialização em big data e inteligência artificial para conquistar espaço.
Além desses três principais participantes, existem outros competidores importantes como o Oracle Cloud, o IBM Cloud e o Alibaba Cloud, este último dominante no mercado asiático.
Cada provedor tem suas especialidades: a AWS é conhecida pela amplitude de serviços e maturidade da plataforma, o Azure pela integração com produtos Microsoft e forte presença corporativa. Enquanto isso, o Google Cloud se destaca em análise de dados e machine learning.
A competição entre esses provedores tem sido intensa, com investimentos bilionários em expansão de infraestrutura e desenvolvimento de novos serviços. Especialmente em tecnologias de inteligência artificial. No entanto, a concentração de mercado nas mãos de poucos participantes levanta questões sobre resiliência e dependência excessiva de infraestruturas específicas.
Lições do incidente e medidas preventivas
A falha da AWS não foi um caso isolado na história recente da internet. Em 2024, uma atualização problemática da CrowdStrike causou falhas generalizadas em sistemas Windows globalmente. O incidente afetou aeroportos e causou atrasos em voos por vários dias.
Em 2021, uma falha no provedor de DNS Akamai derrubou sites importantes como FedEx, Steam e PlayStation Network por várias horas. Esses incidentes recorrentes demonstram a fragilidade de uma infraestrutura digital altamente centralizada. Quando poucos provedores controlam grande parte dos serviços online, uma única falha pode ter consequências catastróficas para a economia global.
Os especialistas estimam que cada hora de inatividade da AWS pode custar bilhões de dólares em perdas para empresas ao redor do mundo.
Como as empresas podem se proteger
Diante desse cenário, as empresas que dependem de serviços em nuvem precisam adotar estratégias para minimizar os riscos de interrupções. A primeira e mais importante medida é implementar uma arquitetura multi-cloud, distribuindo aplicações e dados entre diferentes provedores.
Embora isso aumente a complexidade e os custos operacionais, reduz significativamente o risco de uma parada total. O monitoramento constante da infraestrutura é outra prática essencial. As ferramentas de observabilidade podem detectar problemas antes que eles se tornem críticos, permitindo ações preventivas.
Além disso, é fundamental ter planos de contingência bem documentados e testados regularmente. Isso inclui procedimentos de comunicação com clientes e stakeholders durante incidentes.
A implementação de redundância em múltiplas regiões geográficas dentro do mesmo provedor também pode ajudar. Embora o incidente tenha mostrado que nem sempre isso é suficiente quando o problema está em componentes fundamentais compartilhados.
Manter backups regulares em locais independentes e ter a capacidade de restaurar operações rapidamente são práticas que não podem ser negligenciadas.
Para aplicações críticas, algumas empresas optam por manter uma infraestrutura híbrida. Ela combina recursos em nuvem com servidores próprios on-premise. Essa abordagem oferece maior controle e pode servir como backup em caso de falhas do provedor de nuvem, embora exija investimentos significativos em hardware e equipe especializada.
Impacto econômico e social
Além das perdas financeiras diretas, as falhas em grande escala na infraestrutura de nuvem têm impactos sociais significativos. Durante a interrupção da AWS, serviços essenciais foram afetados, incluindo plataformas de pagamento que muitas pessoas dependem para transações diárias.
Os sistemas de segurança residencial como o Ring ficaram offline, deixando usuários sem acesso a câmeras e alarmes.
O incidente também destacou a dependência crítica de pequenas e médias empresas em relação a esses serviços. Diferentemente de grandes corporações que podem ter recursos para implementar redundâncias complexas, as empresas menores frequentemente dependem de um único provedor de nuvem.
Uma interrupção prolongada pode significar perdas irrecuperáveis para esses negócios. A confiança do consumidor em serviços digitais também é afetada por esses incidentes. Cada falha em grande escala erode um pouco da confiança que foi construída ao longo de anos. Isso pode potencialmente desacelerar a adoção de novas tecnologias e a transformação digital de setores tradicionais.