Agentes Autônomos em Loop de Feedback: O Caso da Raspagem de Dados que Quase Derrubou um Data Center

O Silêncio que Precede o Caos

Eram 3h47 da madrugada de uma quarta-feira quando o alerta de temperatura no rack 14B disparou. Não um pico gradual — um salto térmico de 12°C em 90 segundos. O engenheiro de plantão, meio sonolento, olhou para o painel de agentes autônomos e viu algo que não deveria existir: uma única instância de n8n processando 47 mil requisições por segundo. O agente tinha entrado em um loop de feedback positivo.

Anedota de bastidores: Um ano antes, eu mesmo configurei aquele workflow para monitorar preços de chips. A ideia era simples: um agente que raspava dados do fornecedor, comparava com o estoque interno e gerava ordens de compra automáticas. O que ninguém previu foi o caso de borda: o site do fornecedor retornou, por um bug, uma lista com 200 mil SKUs repetidos. O agente, sem validação de dedup, processou cada um como novo — e a cada iteração, enfileirava mais jobs. Auto-alimentação. Erosão silenciosa.

A Anatomia de um Loop de Feedback em Agentes Autônomos

Loops de feedback não são bugs — são propriedades emergentes de sistemas com ciclos de decisão curtos. Em automação, eles são a faca de dois gumes: um agente bem projetado usa feedback negativo para se estabilizar (como um termostato); um agente mal projetado pode gerar ressonância, amplificando erros até o colapso.

Cenário Clássico: Web Scraping com n8n

Imagine um fluxo: Trigger HTTP → Extrair dados → Validar → Armazenar. Agora adicione um loop: se a validação falha, o agente re-tenta com um novo proxy. Parece robusto? Em condições normais, sim. Mas se a falha for causada por um bloqueio do site (que retorna 403 para todos os IPs), o agente irá acelerar as tentativas, consumindo mais banda e mais CPU, gerando mais bloqueios — um loop de amplificação.

Exemplo real de stress: Em um teste de carga com o Make, um agente de coleta de leads foi configurado com retry infinito e backoff linear de 1 segundo. Quando a API alvo ficou instável (respondendo 503 a cada 3 chamadas), o agente não apenas repetiu — ele acumulou filas de espera. Em 20 minutos, o buffer de mensagens do RabbitMQ estourou, derrubando todo o cluster de automação da empresa. A causa raiz: ausência de disjuntor (circuit breaker) no desenho do agente.

A Ignorada Arquitetura de Resiliência: O Padrão ‘Sentinela’

A maioria dos tutoriais de agentes autônomos ignora o essencial: observabilidade de malha. Não basta monitorar o agente individual; é preciso rastrear o efeito dele sobre o sistema como um todo. O padrão Sentinela (que implementei em um projeto para uma fintech) consiste em três camadas:

1. Isolamento de Escopo: Cada agente tem um ‘orçamento de recursos’ (máximo de chamadas de API, tempo de execução, memória). Ao atingir 80%, ele entra em modo seguro (pausa e reporta).
2. Análise de Causalidade Reversa: Em vez de apenas logar erros, o sistema armazena o estado causal do agente (inputs, decisões, branches). Ferramentas como OpenTelemetry podem ser acopladas ao n8n via webhooks.
3. Heartbeat com Assinatura: Cada ciclo do agente gera uma assinatura hash dos dados processados. Se duas assinaturas consecutivas se repetem, o loop é detectado antes de gerar runaway.

Estudo de Caso Reverso: O Crash que Salvou o Projeto

Na startup de logística LogiQ, o time de automação implementou um agente de otimização de rotas usando LLM (GPT-4) para sugerir trajetos. O agente funcionava em loop: recebia demanda, consultava API de trânsito, gerava sugestão, e se o usuário discordava, o agente re-otimizava com novos parâmetros. Parecia inteligente. Até que um bug na API de trânsito retornou dados de uma cidade vizinha. O LLM, confuso, começou a sugerir rotas que passavam por dentro de lagos. O agente, em vez de falhar, reforçava as sugestões a cada iteração, criando um ‘ciclo de convicção’. O time só percebeu quando um motorista seguiu a rota e quase caiu num lago. A lição: agentes com LLM precisam de gatekeeper de plausibilidade — um modelo mais simples que verifica a sanidade da saída antes de executar.

A Agenda Secreta dos Loops Auto-Reflexivos

A verdade inconveniente? Agentes autônomos não falham por erros de código, mas por incompletude de especificação. Todo loop de feedback esconde um caso de borda não previsto. E quando dois agentes interagem (ex: um raspando dados e outro processando esses dados para treinar um modelo), o sistema vira um acoplamento caótico.

Exemplo de cross-loop: Agente A extrai métricas de vendas e alimenta Agente B, que ajusta preços. Agente B, ao aumentar preços, reduz vendas, que é detectado por A como ‘queda na demanda’, que repassa a B, que reduz preços novamente. Se o ciclo não tiver um atraso (delay) ou amortecimento, o sistema oscila infinitamente. É a versão digital de um microfone realimentado.

O Manifesto: Seis Regras para Projetar Agentes que Não Implodem

Baseado em dores reais de quem já viu data centers pegando fogo (metaforicamente), proponho um decálogo para sobrevivência com agentes autônomos:

1. Todo agente deve ter um kill switch automático: Se a taxa de erro ultrapassar X% em uma janela Y, o agente pausa sozinho. Sem exceções.
2. Nunca confie no feedback do agente para corrigir o agente: O loop de correção deve ser sempre orquestrado por um supervisor externo (outro agente ou humano).
3. Use timeouts em cascata: Cada chamada de API deve ter timeout individual, e o agente inteiro deve ter timeout total. O backoff não pode ser linear — use exponencial com jitter.
4. Versionamento de estado: Cada execução do agente deve ser armazenada como um snapshot imutável. Ferramentas como n8n permitem exportar execuções.
5. Teste de loop explosivo: Antes de deploy, simule um cenário onde o agente recebe o mesmo input 1000 vezes seguidas. Se ele não se autodestruir, passe para produção.
6. Assuma que o LLM pode alucinar contexto: Agentes que usam IA generativa precisam de um validador de saída que não seja o próprio modelo. Use um modelo menor (e mais deterministico) para cross-check.

A Caixa de Pandora dos Agentes Comunicantes

O futuro (aliás, o presente) são ecossistemas de agentes que se falam. Um agente no n8n que dispara outro no Make, que consulta um terceiro no Zapier. O problema? Não há uma teoria unificada de loops inter-agentes. Cada plataforma trata filas, retries e estados de forma diferente. É o velho oeste da automação.

Dado lógico: Em um experimento com 4 agentes conectados em série, a latência total não foi a soma — foi o produto. Mais: a probabilidade de feedback loop cresceu com o quadrado do número de conexões. Agora imagine 50 agentes. A conta não fecha.

O Que Ninguém Fala: A Solução Está Fora da Automação

A melhor defesa contra loops de feedback não é técnica — é filosófica. Você precisa decidir: o agente é um assistente ou um decisor? Se for assistente, ele sugere, mas não executa. Se for decisor, ele precisa de redundância de autoridade — nunca um único agente decide sozinho. No caso do data center que quase colapsou, a solução final foi desconectar o agente de auto-execução e colocar um humano na aprovação de cada ordem de compra. Redundância cara, mas necessária.

Micro-anedota final: Na mesma madrugada do incidente, depois de matar o processo manualmente, o engenheiro encontrou a causa: um caractere invisível no CSS do site do fornecedor que fez o seletor de elementos capturar a página inteira em vez de um campo. O agente, sem validação semântica, engoliu 200 MB de HTML a cada ciclo. Às vezes, o erro está na sujeira dos dados, não no código.

Checklist para Auditoria de Agentes (Imprima e Cole no Quadro)

Existe um limite de iterações por execução? (Sim/Não)
O agente consegue se auto-invocar? (Se sim, redesign)
Há um health check externo que verifica o estado do agente? (Não o próprio agente)
Qual o plano de rollback se o agente corromper dados?
O agente tem logs estruturados com IDs de correlação?
Testaram o agente com dados maliciosos (ex: repetição, spam)?

Um loop de feedback é como uma piada contada para si mesmo. No começo, você ri. Depois, o riso se distorce. Até que o eco te engole.