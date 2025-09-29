Na corrida pelo próximo grande modelo de inteligência artificial, a americana Anthropic anunciou nesta segunda-feira, 29, o lançamento do Claude Sonnet 4.5, descrito pela empresa como o salto mais confiável já dado em tarefas de programação.

O modelo, disponível na API da companhia e no chatbot Claude, tem o mesmo preço de sua versão anterior — US$ 3 por milhão de tokens de entrada e US$ 15 por milhão de saída. A promessa é ambiciosa: segundo a Anthropic, o Claude Sonnet 4.5 não apenas gera protótipos, mas pode construir aplicações “prontas para produção”.

Em testes com empresas parceiras, a IA teria conseguido codar de forma autônoma por até 30 horas seguidas, criando bancos de dados, comprando domínios e até conduzindo auditorias de segurança.

A Anthropic afirma que o modelo entrega performance de ponta em benchmarks de programação, como o SWE-Bench Verified, usado por pesquisadores para medir a capacidade de IAs resolverem problemas complexos de software.

CEOs de startups que usam Claude, como Cursor e Windsurf, reforçaram em comunicados que o Sonnet 4.5 representa uma “nova geração de modelos de programação”.

Mas os números contam uma história menos absoluta. Nos últimos meses, o GPT-5, da OpenAI, superou modelos da Anthropic em uma série de testes de engenharia de software. A disputa entre empresas tornou-se tão acirrada que dificilmente qualquer lançamento mantém liderança clara por mais de algumas semanas.

O que muda para desenvolvedores

O anúncio não trouxe apenas o modelo. A Anthropic lançou também o Claude Agent SDK, kit que permite a desenvolvedores criarem seus próprios agentes autônomos — infraestrutura usada internamente no Claude Code. Para assinantes da versão Max, haverá ainda um preview experimental chamado Imagine with Claude, que mostra o modelo escrevendo software em tempo real, sem funções pré-determinadas.

Esses recursos refletem uma tendência mais ampla: as IAs estão deixando de ser apenas ferramentas de apoio e começam a assumir papéis de agentes, capazes de executar cadeias inteiras de tarefas de forma autônoma.

A Anthropic também diz ter avançado em outro ponto sensível: a “alinhamento” dos modelos. O Sonnet 4.5 teria taxas menores de bajulação (sycophancy), de respostas enganosas e de vulnerabilidade a ataques de injeção de prompt. Em um mercado no qual falhas de segurança podem comprometer empresas inteiras, esse tipo de promessa pode pesar tanto quanto a velocidade ou a precisão do código gerado.

Competição sem trégua

O Sonnet 4.5 chega menos de dois meses após o lançamento do Claude Opus 4.1. A cadência acelerada — típica também de rivais como a OpenAI e o Google DeepMind — mostra que a disputa está menos em “quem tem a melhor IA” e mais em “quem consegue manter a frente por mais tempo”.

No fim, a pergunta central permanece: Claude Sonnet 4.5 é realmente a melhor IA do mercado? Nos benchmarks, pode até estar no topo. Mas, na prática, o cenário é mais volátil — e para desenvolvedores e empresas, o que importa será menos o pódio e mais a confiabilidade no dia a dia.