A Cloudflare enfrentou nesta terça-feira (18) uma das mais longas e amplas instabilidades recentes em sua infraestrutura global. O incidente afetou múltiplos serviços essenciais — como Access, CDN, Firewall, Bot Management, Dashboard, WARP e Workers — e gerou erros intermitentes em diferentes regiões do mundo.

O status oficial do incidente pode ser acessado aqui.
A seguir, analisamos os principais momentos da falha, seus impactos e as ações de recuperação realizadas pela companhia.
Linha do tempo da falha: da investigação ao restabelecimento dos serviços
A instabilidade começou às 11h48 UTC, quando a Cloudflare publicou a primeira notificação informando que estava “experiencing an internal service degradation” e que alguns serviços poderiam sofrer impacto intermitente. A empresa afirmou que estava focada em restaurar o serviço e publicaria atualizações conforme possível.
Pouco depois, entre 12h03 e 12h53 UTC, as equipes continuaram investigando o problema, enquanto clientes seguiam observando erros acima do normal. Embora a Cloudflare mencionasse que alguns serviços estavam começando a se recuperar, o cenário permanecia instável e a empresa mantinha o monitoramento ativo.
Às 13h04 UTC, a Cloudflare informou que havia desabilitado o WARP em Londres como parte das tentativas de mitigação. O comunicado dizia claramente que “Users in London trying to access the Internet via WARP will see a failure to connect”.
Esse foi um dos poucos pontos com impacto regional explícito descrito pela empresa.
Em seguida, às 13h13 UTC, a empresa relatou que alterações aplicadas permitiram que Cloudflare Access e WARP retornassem aos níveis de erro pré-incidente. Além disso, o acesso via WARP em Londres foi reativado.
Durante as horas seguintes — entre 13h35 e 16h46 UTC — a Cloudflare publicou diversas atualizações sobre a recuperação progressiva dos serviços. Apesar disso, alguns clientes ainda enfrentavam latência elevada, falhas intermitentes e problemas no painel (dashboard).
Às 14h42 UTC, a Cloudflare indicou que havia implementado um fix e que acreditava que o incidente estava resolvido, embora o monitoramento continuasse. No entanto, atualizações subsequentes mostraram que ainda havia impacto residual.
Somente às 17h44 UTC a empresa afirmou que “Cloudflare services are currently operating normally” e recomendou que clientes reabilitassem serviços eventualmente desativados durante o incidente.
Por fim, às 19h28 UTC, a Cloudflare declarou oficialmente o incidente como resolvido.
Impactos sobre usuários e empresas ao redor do mundo
A lista de serviços afetados mostra que o incidente teve abrangência global e atingiu áreas críticas da plataforma:
-
Access
-
Bot Management
-
CDN/Cache
-
Dashboard
-
Firewall
-
Network
-
WARP
-
Workers
Como resultado, organizações que dependem da Cloudflare para controle de acesso, aceleração de conteúdo, mitigação de bots, conectividade corporativa via WARP e aplicações serverless puderam observar falhas e lentidão ao longo do dia.
Além disso, o dashboard — ferramenta central para operações e administração — também apresentou indisponibilidade. Portanto, muitas equipes ficaram temporariamente sem visibilidade operacional e sem capacidade plena de alterar configurações.
A própria Cloudflare destacou que bot scores sofreriam impacto durante a recuperação global, o que poderia afetar mecanismos automatizados de segurança.
No entanto, a empresa também relatou que não realizou mudanças de configuração durante o período de estabilização final, buscando evitar efeitos colaterais enquanto analisava a causa raiz.
Do ponto de vista brasileiro, embora o incidente não tenha destacado impacto regional específico para o país, é importante observar que muitos serviços críticos hospedados ou acelerados pela Cloudflare atendem empresas brasileiras. Assim, impactos indiretos podem ter sido percebidos em aplicações nacionais que utilizam a infraestrutura global da empresa.
Comunicação, recuperação progressiva e próximos passos da Cloudflare
Ao longo do incidente, a Cloudflare manteve uma cadência de atualizações frequentes — às vezes com intervalos de poucos minutos. Essa postura trouxe mais previsibilidade, mesmo quando muitas informações ainda estavam sendo levantadas.
Por exemplo, às 16h27 UTC, a empresa destacou que ainda havia erros intermitentes e que a equipe buscava acelerar a recuperação. Além disso, às 16h04 UTC, alertou que os bot scores seriam afetados durante o processo global de restauração.
Já na etapa final, às 17h14 e 17h44 UTC, a Cloudflare revelou que:
-
Os erros e a latência estavam retornando ao normal.
-
Nenhuma alteração de configuração estava sendo aplicada.
-
Era seguro reabilitar serviços que haviam sido desativados por clientes.
Por fim, a Cloudflare confirmou que fará uma investigação pós-incidente e disponibilizará detalhes assim que possível. Esse relatório deve esclarecer as causas da falha e os pontos que levaram à instabilidade prolongada.
Conclusão
A instabilidade global da Cloudflare mostrou como até grandes fornecedores de infraestrutura podem enfrentar problemas complexos que afetam diversos serviços simultaneamente. Ainda assim, a recuperação progressiva e a comunicação contínua ajudaram a reduzir incertezas ao longo do dia.
Com a promessa de um relatório final, empresas e equipes de segurança poderão entender melhor o que ocorreu e preparar estratégias de contingência mais robustas para incidentes semelhantes.