Aprendizado

Managed Agents — Anthropic Engineering

Como a Anthropic desacoplou o 'cérebro' das 'mãos' em sistemas de agentes. Arquitetura Session/Harness/Sandbox com 60% de redução no tempo de resposta.

O que e

Managed Agents — Anthropic Engineering

A Anthropic publicou no blog de engenharia como resolveu um problema fundamental: harnesses (o código que gerencia agentes) codificam suposições sobre limitações do modelo — e ficam obsoletos conforme os modelos melhoram. A solução foi desacoplar três componentes: Session (log de eventos), Harness (o cérebro) e Sandbox (as mãos de execução).

Na arquitetura Managed Agents, cada componente evolui de forma independente via interfaces padronizadas: execute(name, input), provision({resources}), wake(sessionId) e getEvents(). O harness não sabe se o sandbox é um container, um celular ou outro dispositivo — só precisa que aceite execute() e retorne strings. Isso elimina acoplamento desnecessário e permite múltiplos "brains" coordenando múltiplos "hands".

O resultado prático foi expressivo: ao tirar o harness de dentro dos containers, a inferência começa imediatamente enquanto eventos pendentes são carregados em paralelo. O p50 de time-to-first-token caiu ~60% e o p95 caiu mais de 90%. É um artigo essencial para quem está construindo sistemas de agentes em produção.

Como funciona

Principais recursos

Desacoplamento Brain / Hands

O "cérebro" (harness + modelo) é separado das "mãos" (sandbox de execução). Cada componente evolui de forma independente conforme os modelos melhoram — sem redesenho arquitetural.

Session — Event Log Durável

A sessão é um log append-only de todos os eventos. Vive fora da janela de contexto do Claude — o harness seleciona, transforma e rebobina eventos conforme necessário para tarefas longas.

Harness Resiliente

Se o harness falhar, um novo retoma de onde parou via wake(sessionId). Sem perda de progresso — a inferência começa imediatamente enquanto eventos pendentes são puxados do log.

Sandbox como Cattle

Containers são tratados como cattle — descartáveis e substituíveis, não como pets gerenciados manualmente. Falha no container vira um erro de tool-call que o Claude trata naturalmente.

Segurança de Credenciais

Credenciais nunca chegam ao sandbox onde o código do Claude roda. Tokens OAuth ficam em vaults — um proxy faz as chamadas externas. Tokens de repositório autenticam Git antes do código do Claude executar.

60% Menos Tempo de Resposta

Com o harness fora do container, a inferência começa imediatamente. Resultado: p50 time-to-first-token caiu ~60% e p95 caiu mais de 90% — sem nenhuma mudança no modelo.

Comece agora

Explore o repositorio, contribua com melhorias ou integre na sua operacao.