Patrocinado por:
( rawpixel.com/Freepik)
Repórter
Publicado em 4 de julho de 2026 às 07h49.
Com o aumento na quantidade de ferramentas de inteligência artificial (IA) disponíveis, cresceu também o valor gasto pelos usuários para assinar as principais plataformas, como o ChatGPT e o Claude. Assim como aconteceu com o streaming, a nova briga do setor deixou de ser sobre o que a tecnologia faz e passou a ser sobre quanto a pessoa está disposta a pagar para usá-la.
Nas últimas semanas, os dois nomes mais valiosos do setor — a OpenAI, dona do ChatGPT, e a Anthropic, criadora do Claude — foram empurrados para a beira de uma guerra de preços. Mas quem realmente força o custo da IA para baixo não são elas. Do outro lado do mundo, os modelos chineses entregam desempenho parecido por uma fração do valor.
O estopim, segundo o Wall Street Journal, foi o fato de a OpenAI estudar reduzir o preço que cobra pelos tokens — as pequenas unidades de texto que servem de base para o faturamento das empresas de IA. O gatilho imediato foi a Anthropic, que vinha tomando clientes da rival. No pano de fundo, porém, há uma pressão maior e mais barata vinda do Oriente.
A rivalidade direta começou com o Claude Code, o agente de programação autônoma da Anthropic, que viralizou entre desenvolvedores e turbinou a receita da empresa.
Impulsionada por essa adoção, a Anthropic ultrapassou a OpenAI em avaliação de mercado pela primeira vez, e sua taxa de receita anualizada saltou de cerca de US$ 9 bilhões no fim de 2025 para um patamar estimado em US$ 47 bilhões em maio de 2026, segundo a publicação The Information.
Diante da perda de terreno, o presidente-executivo da OpenAI, Sam Altman, reconheceu que o custo da IA é "um grande problema" para as empresas clientes e prometeu encontrar "formas de ajudar as pessoas a ter mais valor por menos gasto". A defesa mais rápida, quando um concorrente vence pelo preço, é baixar o próprio preço.
A verdade incômoda para as duas americanas é que a guerra de preços já estava em curso antes de elas entrarem nela — puxada pela China. Modelos de código aberto como o DeepSeek, o GLM, da Zhipu, e o Kimi, da Moonshot, alcançaram qualidade de fronteira cobrando muito menos, ao priorizar a eficiência por tarefa em vez do desempenho máximo em testes.
A diferença de preço é grande. Segundo a firma de análise Artificial Analysis, rodar uma mesma carga de trabalho no Claude, da Anthropic, custa US$ 4.811, enquanto o mesmo trabalho no modelo GLM, da Zhipu, sai por US$ 544 — quase nove vezes mais barato. Em alguns comparativos, a diferença entre os modelos ocidentais e os chineses chega a 13 vezes. Para empresas que já reclamavam da conta, a matemática ficou impossível de ignorar.
Como resumiu Tommy Shaughnessy, da gestora Delphi Ventures, em análise que circulou no setor, o modelo de IA é o maior custo de um provedor de inferência — e os laboratórios chineses o obtêm de graça, ao abrir o código de modelos de ponta. Enquanto a China seguir liberando esses modelos gratuitamente, o piso do preço da IA continuará caindo em direção a zero.
A pressão para baixar preços não vem só da concorrência, mas dos próprios clientes, revoltados com faturas que consideram insustentáveis. O setor apelidou o fenômeno de tokenmaxxing: a prática de queimar o máximo de tokens possível, muitas vezes sem medir o retorno.
O caso mais citado é o da Uber. Segundo seu diretor de tecnologia, Praveen Neppalli Naga, em depoimento à The Information, a empresa esgotou todo o orçamento de IA de 2026 em apenas quatro meses — puxada pela adoção do Claude Code, que saltou de 32% para 84% dos seus 5 mil engenheiros, a um custo mensal de US$ 500 a US$ 2.000 por profissional. "Voltamos à prancheta", admitiu o executivo. Analistas do JP Morgan chegaram a publicar uma nota com o título "As contas de IA estão fora de controle".
Diante da conta alta, as empresas encontraram uma saída que aperta ainda mais as gigantes ocidentais: usar o barato para o grosso do trabalho e o caro só quando necessário. A técnica ganhou o nome de "modelo consultor".
Na prática, uma IA barata, geralmente chinesa e de código aberto, executa a maior parte das tarefas como padrão. Quando esbarra em um problema que não consegue resolver, aciona um modelo de fronteira da OpenAI ou da Anthropic apenas para aquele trecho — reduzindo a fatura ao mínimo.
Uma startup citada pelo Wall Street Journal chegou a migrar 90% de sua carga de trabalho do Claude e do Gemini para modelos próprios e para o chinês GLM.
Cortes de preço já vinham acontecendo antes da guerra ganhar esse nome.
A Anthropic reduziu o preço do Claude Opus em 67% no lançamento de uma versão anterior, e a OpenAI oferece processamento com desconto de 50% para tarefas menos urgentes. A tendência estrutural é de barateamento.
A consultoria Gartner projeta que, até 2030, rodar um grande modelo vai custar quase 90% menos do que em 2025.
E há quem veja o movimento com otimismo. Como a demanda por tokens cresce mais rápido do que o preço cai, os cortes podem estimular ainda mais consumo, em vez de derrubar a receita.
Segundo a Gartner, o gasto global com modelos de IA deve praticamente dobrar, de US$ 15,5 bilhões em 2025 para US$ 32,6 bilhões em 2026 — ou seja, mesmo com o preço unitário em queda, o bolo total continua crescendo.
O que torna essa guerra diferente é que ela pode não ter um vencedor entre os gigantes.
Numa disputa em que a China empurra o preço para perto de zero, os clientes adotam o "modelo consultor" e as margens das líderes ocidentais já são apertadas, é possível que nem a OpenAI nem a Anthropic saiam ganhando a guerra que estão prestes a travar.
Para o consumidor, o efeito imediato é bem-vindo: a IA está ficando mais barata, mais rápido do que se imaginava.
Assim como o streaming prometeu acesso infinito antes de descobrir que alguém teria de pagar a conta, a IA enfrenta agora a mesma pergunta — o que acontece com quem banca a fronteira da tecnologia quando o produto mais avançado do mundo começa a ser ditado por quem o oferece de graça.