Cloudflare sofre instabilidade global e recupera serviços após horas de interrupção

A Cloudflare enfrentou nesta terça-feira (18) uma das mais longas e amplas instabilidades recentes em sua infraestrutura global. O incidente afetou múltiplos serviços essenciais — como Access, CDN, Firewall, Bot Management, Dashboard, WARP e Workers — e gerou erros intermitentes em diferentes regiões do mundo.

O status oficial do incidente pode ser acessado aqui.

A seguir, analisamos os principais momentos da falha, seus impactos e as ações de recuperação realizadas pela companhia.

Linha do tempo da falha: da investigação ao restabelecimento dos serviços

A instabilidade começou às 11h48 UTC, quando a Cloudflare publicou a primeira notificação informando que estava “experiencing an internal service degradation” e que alguns serviços poderiam sofrer impacto intermitente. A empresa afirmou que estava focada em restaurar o serviço e publicaria atualizações conforme possível.

Pouco depois, entre 12h03 e 12h53 UTC, as equipes continuaram investigando o problema, enquanto clientes seguiam observando erros acima do normal. Embora a Cloudflare mencionasse que alguns serviços estavam começando a se recuperar, o cenário permanecia instável e a empresa mantinha o monitoramento ativo.

Às 13h04 UTC, a Cloudflare informou que havia desabilitado o WARP em Londres como parte das tentativas de mitigação. O comunicado dizia claramente que “Users in London trying to access the Internet via WARP will see a failure to connect”.

Esse foi um dos poucos pontos com impacto regional explícito descrito pela empresa.

Em seguida, às 13h13 UTC, a empresa relatou que alterações aplicadas permitiram que Cloudflare Access e WARP retornassem aos níveis de erro pré-incidente. Além disso, o acesso via WARP em Londres foi reativado.

Durante as horas seguintes — entre 13h35 e 16h46 UTC — a Cloudflare publicou diversas atualizações sobre a recuperação progressiva dos serviços. Apesar disso, alguns clientes ainda enfrentavam latência elevada, falhas intermitentes e problemas no painel (dashboard).

Às 14h42 UTC, a Cloudflare indicou que havia implementado um fix e que acreditava que o incidente estava resolvido, embora o monitoramento continuasse. No entanto, atualizações subsequentes mostraram que ainda havia impacto residual.

Somente às 17h44 UTC a empresa afirmou que “Cloudflare services are currently operating normally” e recomendou que clientes reabilitassem serviços eventualmente desativados durante o incidente.

Por fim, às 19h28 UTC, a Cloudflare declarou oficialmente o incidente como resolvido.

Impactos sobre usuários e empresas ao redor do mundo

A lista de serviços afetados mostra que o incidente teve abrangência global e atingiu áreas críticas da plataforma:

Access
Bot Management
CDN/Cache
Dashboard
Firewall
Network
WARP
Workers

Como resultado, organizações que dependem da Cloudflare para controle de acesso, aceleração de conteúdo, mitigação de bots, conectividade corporativa via WARP e aplicações serverless puderam observar falhas e lentidão ao longo do dia.

Além disso, o dashboard — ferramenta central para operações e administração — também apresentou indisponibilidade. Portanto, muitas equipes ficaram temporariamente sem visibilidade operacional e sem capacidade plena de alterar configurações.

A própria Cloudflare destacou que bot scores sofreriam impacto durante a recuperação global, o que poderia afetar mecanismos automatizados de segurança.

No entanto, a empresa também relatou que não realizou mudanças de configuração durante o período de estabilização final, buscando evitar efeitos colaterais enquanto analisava a causa raiz.

Do ponto de vista brasileiro, embora o incidente não tenha destacado impacto regional específico para o país, é importante observar que muitos serviços críticos hospedados ou acelerados pela Cloudflare atendem empresas brasileiras. Assim, impactos indiretos podem ter sido percebidos em aplicações nacionais que utilizam a infraestrutura global da empresa.

Comunicação, recuperação progressiva e próximos passos da Cloudflare

Ao longo do incidente, a Cloudflare manteve uma cadência de atualizações frequentes — às vezes com intervalos de poucos minutos. Essa postura trouxe mais previsibilidade, mesmo quando muitas informações ainda estavam sendo levantadas.

Por exemplo, às 16h27 UTC, a empresa destacou que ainda havia erros intermitentes e que a equipe buscava acelerar a recuperação. Além disso, às 16h04 UTC, alertou que os bot scores seriam afetados durante o processo global de restauração.

Já na etapa final, às 17h14 e 17h44 UTC, a Cloudflare revelou que:

Os erros e a latência estavam retornando ao normal.
Nenhuma alteração de configuração estava sendo aplicada.
Era seguro reabilitar serviços que haviam sido desativados por clientes.

Por fim, a Cloudflare confirmou que fará uma investigação pós-incidente e disponibilizará detalhes assim que possível. Esse relatório deve esclarecer as causas da falha e os pontos que levaram à instabilidade prolongada.

Conclusão

A instabilidade global da Cloudflare mostrou como até grandes fornecedores de infraestrutura podem enfrentar problemas complexos que afetam diversos serviços simultaneamente. Ainda assim, a recuperação progressiva e a comunicação contínua ajudaram a reduzir incertezas ao longo do dia.

Com a promessa de um relatório final, empresas e equipes de segurança poderão entender melhor o que ocorreu e preparar estratégias de contingência mais robustas para incidentes semelhantes.

About The Author

André Ortega

Formando em Processamento de Dados e Ciência da Computação. Especialista Cisco (CCNP Enterprise e CCNP Security). Vinte anos de experiência com redes e segurança.

See author's posts

Relacionado

victorinoadmin em Componentes AVI Networks Load Balancer (NSX Advanced Load Balancer)24/11/2025
Ótimo material! Seria bem legal se aprofundar mais no tema.
./fernando em Aprenda Python e ganhe pontos para renovar as certificações CCNA, CCNP e CCIE29/10/2024
Excelente conteúdo, André! Obrigado por compartilhar.
André Ortega em Reset Cisco FTD (zerar FTD sem reinstalar)18/10/2024
Quando é feito o reset, sim volta a ter os 90 dias de trial. No procedimento acima, confesso que não…
ALEX LIRA CAMACHO em Reset Cisco FTD (zerar FTD sem reinstalar)15/10/2024
Muito boa a dica, mas ficou a duvida sobre a licença, com reset de fabrica ela volta para os 90…
André Ortega em Atualizando Cisco 9300 (Install Mode)30/08/2024
Olá Dominique. Essas são os arquivos usados para cada modo (install ou bundle). O modo install (que "quebra o arquivo…

André Ortega

Deixe um comentário Cancelar resposta

Related Stories

Configurando Syslog no Cisco Firewall (FMC)

Senhas vazadas em escala: lições do relatório 2026

Certificados de Usuário para Autenticação 802.1x

You may have missed

Configurando Syslog no Cisco Firewall (FMC)

Como identificar um MAC Address aleatório (Locally Administered)

Senhas vazadas em escala: lições do relatório 2026

Certificados de Usuário para Autenticação 802.1x