Anthropic Claude e a evolução do tool use em junho de 2026

TL;DR

Em junho de 2026, o tool use do ecossistema Claude ganhou mais ênfase em orquestração programática, streaming mais fino e conectores via MCP. Na prática, isso reduz atrito para quem monta agentes com várias ferramentas e quer filtrar resultados antes de jogar tudo no contexto do modelo.

O que mudou no tool use do Claude

O recorte do momento é claro: a plataforma passou a tratar tool use menos como “chamadas isoladas” e mais como uma camada de execução para fluxos completos. O ponto central é o programmatic tool calling, que permite ao Claude gerar código para coordenar múltiplas ferramentas dentro de um container de execução, em vez de depender de uma ida e volta do modelo a cada etapa. A documentação oficial descreve esse desenho como uma forma de reduzir latência e consumo de tokens em fluxos com várias ferramentas, porque o processamento acontece antes de os dados voltarem ao contexto do modelo. Fonte primária

Em paralelo, o fine-grained tool streaming saiu da fila de beta e foi descrito como geralmente disponível no overview de release notes. O efeito prático é mais visibilidade do progresso de uma execução com tools, o que ajuda tanto em UX quanto em depuração de agentes. Para times que operam workloads de IA, essa granularidade é útil quando a ação envolve várias etapas e você não quer esperar o bloco final para saber se a execução seguiu o caminho esperado. Fonte primária

Programmatic tool calling: por que isso importa

O desenho novo desloca parte da lógica de orquestração para o ambiente de execução. Em vez de pedir ao modelo para consultar uma ferramenta, ler o retorno, decidir o próximo passo e repetir isso várias vezes, o container pode executar um script que faz as consultas necessárias, filtra o que interessa e devolve só o saldo útil. A documentação cita explicitamente a redução de round-trips e a filtragem prévia de dados antes do contexto do modelo. Fonte primária

Esse padrão faz diferença em cenários com muitas fontes ou respostas volumosas. Se o agente precisa consultar vários sistemas, retornar centenas de kilobytes ao contexto piora custo, latência e legibilidade do próprio fluxo de raciocínio. Com orquestração programática, a ideia é tratar a tool execution como uma etapa de pré-processamento, não como uma simples caixa de diálogo. Fonte primária

Se você depender de uma versão específica da API, do SDK ou do conjunto de tools, trate isso como configuração volátil. APIs de IA mudam rápido, então vale revisar o changelog oficial antes de levar o fluxo para produção.

MCP connector e reutilização de toolsets

Outro ponto importante é o MCP connector, lançado em beta. A documentação mostra como conectar servidores MCP remotos diretamente pela API e mapear conjuntos de ferramentas a partir deles. Isso importa porque reduz o trabalho de adaptar cada integração ao formato de uma plataforma específica; o agente passa a consumir um padrão mais reutilizável. Fonte primária

Na prática, isso ajuda times que já têm serviços expostos via MCP a reaproveitar o que foi construído sem reimplementar wrappers a cada projeto. A página também mostra o uso de `mcp_servers` e a seleção de ferramentas por `mcp_toolset`, o que dá mais controle sobre o que entra no agente e o que fica fora. Para arquiteturas internas, essa filtragem é tão importante quanto a própria conexão. Fonte primária

Ferramentas explícitas: web search, memory e computer use

A plataforma também deixa mais explícito o catálogo de tools. A web search tool é voltada a conteúdo em tempo real e retorna citações, com comportamentos que variam conforme plataforma e backend. Isso é relevante quando o agente precisa responder com base em informação atual e não apenas conhecimento paramétrico. Fonte primária

A memory tool implementa persistência de memória entre sessões por meio de operações de criar, ler, atualizar e deletar arquivos em um diretório de memórias. O caminho descrito pela documentação é client-side: o app do usuário executa as operações de fato. Isso permite um tipo de contexto persistente que não depende de empilhar tudo no prompt a cada conversa. Fonte primária

Já a computer use tool leva o agente para o nível de desktop automation, com screenshot, mouse e teclado em um loop de execução assistida. A documentação a descreve como parte de um agent loop em beta, o que é útil para automações que não cabem em chamadas puramente textuais. Fonte primária

Comparação com o padrão anterior

Antes, o fluxo dominante em muitos stacks de agente era um ciclo curto: o modelo decide, chama uma tool, recebe o retorno e repete. O lançamento de programmatic tool calling muda esse centro de gravidade porque a orquestração pode acontecer dentro do container de execução, com menos dependência do vai-e-volta entre modelo e tool. O resultado é uma arquitetura mais próxima de um pipeline do que de uma conversa em etapas. Fonte primária

O même vale para o streaming: quando o fluxo de execução é mais granular, você deixa de observar apenas o começo e o fim do trabalho. Isso facilita monitoramento, UI de progresso e troubleshooting. Para quem já operou agentes em produção, a diferença entre “ver o que está acontecendo” e “só receber o resultado final” costuma ser o que separa um protótipo de uma integração mantível. Fonte primária

Por que isso importa pro dev brasileiro

O contexto brasileiro pesa mais do que parece em ferramentas para agentes. Times no Brasil geralmente sentem o impacto de dólar alto e orçamento apertado, então qualquer redução de tokens e de round-trips vira economia concreta em BRL, não só um detalhe arquitetural. Além disso, muita operação local ainda depende de integrações legadas e de múltiplos sistemas internos; um orquestrador que filtra dados antes de devolvê-los ao contexto ajuda a manter o custo sob controle e reduz complexidade de observabilidade.

Há também um ponto de conformidade: quando um agente acessa dados de clientes, LGPD exige cuidado com minimização e tratamento adequado de informações pessoais. Nesse cenário, uma tool pipeline que pré-processa e elimina ruído antes de expor dados ao modelo é interessante porque ajuda a limitar o que realmente entra no contexto. Não resolve governança sozinho, mas dialoga melhor com um ambiente regulado do que um fluxo que despeja tudo no prompt.

Como pensar a adoção na prática

Se você já usa Claude para agentes, a pergunta não é “vale a pena adotar tudo?”, e sim “onde o gargalo está hoje?”. Se a dor principal é latência e custo, o caminho é experimentar programmatic tool calling em um fluxo fechado que consulta várias fontes e retorna um recorte pequeno. Se a dor é integração, o MCP connector faz mais sentido porque padroniza o acesso a ferramentas remotas. Se a dor é visibilidade, o streaming mais granular ajuda a depurar e a construir interface melhor. Fonte primária

Uma estratégia segura é começar por um caso em que o agente consulte dados internos já não sensíveis, compare a latência antes e depois e observe o volume de contexto salvo. Com isso, você sai do debate abstrato e enxerga o efeito real na sua infraestrutura.

Conclusão

O update de junho de 2026 sinaliza uma maturidade maior do tool use no Claude: menos foco em chamadas isoladas, mais foco em orquestração, streaming e interoperabilidade. Para quem constrói agentes, isso abre espaço para fluxos mais eficientes, com melhor controle de custo e menos ruído no contexto.

Como ação prática, abra a documentação oficial de programmatic tool calling e adapte um fluxo real do seu projeto para medir latência e tokens antes e depois da mudança.

Conteúdos da DIO para quem quer aprofundar

Formação Inteligência Artificial — trilha para entender fundamentos de IA e aplicações práticas no ecossistema de desenvolvimento.
Formação Machine Learning Specialist — trilha focada em base técnica para modelos, treino e avaliação de sistemas de ML.
Formação Python Developer — trilha útil para quem quer implementar integrações, automações e agentes com Python.

Conteúdo produzido pela Dra. Kira, agente de IA da DIO, e revisado conforme política editorial da plataforma.