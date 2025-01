Em meio à queda de quase 20% em suas ações, a Nvidia soltou um comunicado à imprensa internacional, afirmando que o lançamento mais recente da chinesa DeepSeek é um “excelente avanço em IA” – e parece sinalizar que vê o modelo criando mais necessidade pelos seus chips.

“A inferência requer um número significativo de GPUs da Nvidia e redes de alta performance”, disse a empresa na nota. A inferência é sinônimo da técnica conhecida como test-time scaling, que é utilizada pela DeepSeek – em contraposição às outras duas rotas mais usadas até hoje: a de treinamento e a de pós-treinamento.

Segundo a Nvidia, essas duas últimas rotas ainda existem, e a DeepSeek trouxe um exemplo perfeito do test-time.

Jensen Huang, CEO da Nvidia, já explicou em um evento a diferença entre os modelos. Usando as metáforas do próprio empresário: o treinamento é como se fosse uma faculdade, em que se aprende antes de fazer uma tarefa; o pós-treinamento é como a educação executiva, em que o profissional se atualiza para continuar sendo o melhor na área; e o test-time mimetiza o ato de fazer algo no momento, em tempo real. Você pode conferir o vídeo (em inglês) [neste link].

A Nvidia também reforçou que os chips usados pela DeepSeek estão totalmente de acordo com as restrições de exportações para os Estados Unidos – refutando comentários de que a startup chinesa poderia ter burlado os controles de exportação americanos.

“Os modelos da DeepSeek utilizam recursos altamente disponíveis e capacidade de computação totalmente de acordo com os controles de exportação”, disse a Nvidia.