Managed Agents — Anthropic Engineering
Como a Anthropic desacoplou o 'cérebro' das 'mãos' em sistemas de agentes. Arquitetura Session/Harness/Sandbox com 60% de redução no tempo de resposta.
O que e
Managed Agents — Anthropic Engineering
A Anthropic publicou no blog de engenharia como resolveu um problema fundamental: harnesses (o código que gerencia agentes) codificam suposições sobre limitações do modelo — e ficam obsoletos conforme os modelos melhoram. A solução foi desacoplar três componentes: Session (log de eventos), Harness (o cérebro) e Sandbox (as mãos de execução).
Na arquitetura Managed Agents, cada componente evolui de forma independente via interfaces padronizadas: execute(name, input), provision({resources}), wake(sessionId) e getEvents(). O harness não sabe se o sandbox é um container, um celular ou outro dispositivo — só precisa que aceite execute() e retorne strings. Isso elimina acoplamento desnecessário e permite múltiplos "brains" coordenando múltiplos "hands".
O resultado prático foi expressivo: ao tirar o harness de dentro dos containers, a inferência começa imediatamente enquanto eventos pendentes são carregados em paralelo. O p50 de time-to-first-token caiu ~60% e o p95 caiu mais de 90%. É um artigo essencial para quem está construindo sistemas de agentes em produção.
Como funciona
Principais recursos
Desacoplamento Brain / Hands
O "cérebro" (harness + modelo) é separado das "mãos" (sandbox de execução). Cada componente evolui de forma independente conforme os modelos melhoram — sem redesenho arquitetural.
Session — Event Log Durável
A sessão é um log append-only de todos os eventos. Vive fora da janela de contexto do Claude — o harness seleciona, transforma e rebobina eventos conforme necessário para tarefas longas.
Harness Resiliente
Se o harness falhar, um novo retoma de onde parou via wake(sessionId). Sem perda de progresso — a inferência começa imediatamente enquanto eventos pendentes são puxados do log.
Sandbox como Cattle
Containers são tratados como cattle — descartáveis e substituíveis, não como pets gerenciados manualmente. Falha no container vira um erro de tool-call que o Claude trata naturalmente.
Segurança de Credenciais
Credenciais nunca chegam ao sandbox onde o código do Claude roda. Tokens OAuth ficam em vaults — um proxy faz as chamadas externas. Tokens de repositório autenticam Git antes do código do Claude executar.
60% Menos Tempo de Resposta
Com o harness fora do container, a inferência começa imediatamente. Resultado: p50 time-to-first-token caiu ~60% e p95 caiu mais de 90% — sem nenhuma mudança no modelo.
Comece agora
Explore o repositorio, contribua com melhorias ou integre na sua operacao.