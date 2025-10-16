Com sede em San Sebastián, na Espanha, a startup Multiverse Computing alcançou uma avaliação de mais de US$ 500 milhões ao propor uma abordagem diferente para o desenvolvimento de inteligência artificial: em vez de expandir, encolher.

Em vez de LLMs colossais, a empresa aposta em SLMs, modelos de linguagem simplificada, que operam com menos dados, menor consumo de energia e custos computacionais drasticamente reduzidos.

A proposta não só atraiu o interesse de empresas como Bosch, Moody’s, Telefónica, Banco do Canadá, Intel e Deloitte, como também colocou a startup espanhola no centro do debate sobre o futuro financeiro e energético da IA corporativa. As informações são da Fortune.

Modelos menores, margens maiores

Em um momento em que centro de processamento de dados consomem quase 5% da eletricidade dos EUA, e com projeções da Agência Internacional de Energia indicando que esse número dobrará até 2030, o custo para treinar e rodar LLMs gigantescos (como os que alimentam o ChatGPT) se tornou uma dor de cabeça orçamentária nas empresas e um problema para os investidores.

Segundo a Multiverse, seus modelos compactados economizam até 84% em energia com apenas 2% a 3% de perda de precisão.

A proposta é: economizar energia e reduzir custos computacionais, com impacto direto nas margens operacionais de empresas que utilizam IA em escala.

O CTO da Intel, Stephen Phillips, afirmou que optaram por trabalhar com a startup justamente porque seus modelos "não pareciam perder precisão quando compactados".

Mais do que uma escolha técnica, trata-se de uma decisão de finanças corporativas com impacto ambiental agregado.

Como diz Enrique Lizaso Olmos, CEO da Multiverse: “Se verde significa mais barato, elas são totalmente verdes. A crise energética está chegando.”

Clientes gigantes, infraestrutura leve

A lista de clientes da Multiverse é: de empresas de defesa a companhias elétricas, passando por bancos e operadoras de telefonia.

Um dos casos mais simbólicos foi a reformulação do sistema de atendimento ao cliente da Telefónica, que reduziu drasticamente o custo do LLM usado anteriormente.

Essas soluções são possíveis porque os SLMs da Multiverse podem ser executados em CPUs comuns — como as de notebooks e celulares — em vez das caras GPUs (domínio da Nvidia).

Isso permite baixar o custo de entrada em IA para empresas menores, e reduzir investimentos em infraestrutura para corporações de grande porte.

Com isso, a startup levantou US$ 290 milhões em duas rodadas de financiamento e entrou na lista “Mude o Mundo” da Fortune, reconhecida por seu potencial transformador com viés sustentável.

Tecnologia quântica a serviço da compressão de modelos

Embora seus produtos não sejam computadores quânticos, a Multiverse usa algoritmos inspirados na física quântica para treinar modelos mais rápidos, eficientes e precisos em máquinas comuns.

Com isso, conseguem comprimir modelos abertos como os da Meta e Mistral AI, incluindo uma versão do Llama 3.1 chamada ChickenBrain, e o modelo Superfly, que foi comprimido a ponto de poder ser executado em um celular.

O carro-chefe da startup é o CompactifAI, seu algoritmo de compressão proprietário, que tem sido utilizado para criar versões “slim” de grandes LLMs com custo reduzido e alta performance.

Esse tipo de tecnologia abre um novo capítulo na rentabilidade da IA, tornando o uso mais barato, escalável e energeticamente sustentável — características cada vez mais valorizadas por CFOs e conselhos administrativos.

