Novo modelo mantém o preço do antecessor e chega com novas funcionalidades, como controle de esforço pelo usuário, workflows dinâmicos e modo rápido mais barato
A Anthropic anunciou nesta quinta-feira (28) o Claude Opus 4.8, nova versão do seu modelo mais avançado disponível ao público em geral. O lançamento traz melhorias em uma série de benchmarks, com destaque para tarefas agênticas — aquelas em que o modelo age de forma autônoma para completar objetivos complexos.
Junto com o novo modelo, a Anthropic lançou três novidades: controle de esforço pelo usuário no claude.ai, a funcionalidade dynamic workflows no Claude Code e o modo rápido três vezes mais barato do que nas versões anteriores.
O anúncio acontece apenas 41 dias depois do Opus 4.7. Segundo o TechCrunch, o intervalo é mais curto do que o habitual para a empresa, o que reflete a reação de parte dos usuários da ferramenta que havia recebido a versão anterior com críticas devido às mudanças no tom de conversação e na velocidade. O modelo já está disponível, sem alteração de preço.
O que mudou
O recurso de dynamic workflows (fluxos dinâmicos, em tradução livre) é talvez o mais relevante para desenvolvedores. O sistema foi projetado para ajudar modelos maiores como o Opus a gerenciar tarefas complexas por meio de centenas de subagentes paralelos. Na prática, isso significa que o Claude Code com Opus 4.8 pode planejar e executar migrações em bases de código com centenas de milhares de linhas usando o conjunto de testes existente como parâmetro de qualidade. A funcionalidade está disponível em prévia de pesquisa para os planos Enterprise, Team e Max.
O controle de esforço, por sua vez, permite que usuários do claude.ai e do Cowork escolham o quanto o modelo se dedica a uma resposta. Há quatro níveis: baixo, médio, alto e máximo. Nos níveis mais altos, o modelo pensa com mais profundidade — com impacto correspondente no uso de créditos. O recurso está disponível em todos os planos.
Para desenvolvedores que usam a API diretamente, também houve uma mudança técnica. Conforme levantamento do Codersera, o contexto passa a aceitar 1 milhão de tokens, com output máximo de 128 mil tokens, disponível na API da Anthropic, na Bedrock e no Vertex AI. Além disso, a API de mensagens agora aceita entradas de sistema dentro do próprio array de mensagens, o que permite atualizar instruções em tempo de execução sem quebrar o cache do prompt.
Um dos pontos que a Anthropic também destacou no lançamento é o comportamento do modelo em relação à confiabilidade das próprias respostas. O Opus 4.8 apresentou desempenho de alinhamento significativamente melhor do que o Opus 4.7 e o Sonnet 4.6, aproximando-se do nível do Claude Mythos — modelo de maior capacidade da empresa, ainda com acesso restrito. Na prática, o novo modelo tem cerca de quatro vezes menos probabilidade de deixar passar falhas em código sem sinalizá-las ao usuário, segundo testes internos da Anthropic.
Preço e disponibilidade
O preço padrão para o modelo é o mesmo de seu antecessor: US$ 5 (aproximadamente R$ 25) por milhão de tokens de entrada e US$ 25 (em torno de R$ 125) por milhão de tokens de saída. O modo rápido, que opera a 2,5 vezes a velocidade normal, custa US$ 10 (R$ 50) por milhão de tokens de entrada e US$ 50 (R$ 250) por milhão de saída. Esse modo era mais caro em versões anteriores; o barateamento de três vezes é uma das mudanças práticas mais significativas para equipes que dependem de latência baixa.
O modelo está disponível globalmente e pode ser acessado via API com a string “claude-opus-4-8”, além de estar integrado ao GitHub Copilot — onde está disponível para usuários dos planos Pro+, Business e Enterprise.
*Com supervisão de Rennan Julio
Por: Felipe Medeiros*


