De canguru de apoio emocional à Marisa Maiô, passando pelos vídeos de 'influencers' da Bíblia no TikTok, a criatividade dos usuários encontrou no Google Veo 3 uma nova ferramenta para dar vida a ideias surreais — em vídeo, com som e resolução 4K.

Lançado no Google I/O 2025, o modelo de IA desenvolvido pela DeepMind transforma descrições em texto em vídeos com cenários, personagens e falas gerados automaticamente. A ferramenta aceita também imagens como referência visual.

A principal novidade está na geração automática de áudio — falas, efeitos sonoros e música ambiente — sem exigir comandos específicos no prompt.

Do texto ao vídeo com som e câmera cinematográfica

A entrada pode ser uma frase detalhada como “uma mulher de pele verde fala sobre a Força em uma escadaria de templo, com raios ao fundo e iluminação dramática”. O modelo interpreta o pedido, aplica movimentação de câmera, gera o cenário e insere som compatível.

Usuários ainda podem usar o editor Flow para controlar continuidade visual, ângulos e personagens. Cenas anteriores servem de base para manter consistência em vídeos compostos por múltiplos clipes.

Disponibilidade por assinatura e limites técnicos

Veo 3 está disponível via planos pagos: o AI Ultra (US$ 249,99/mês, exclusivo nos EUA) e o AI Pro (US$ 20/mês, com acesso parcial). Algumas regiões oferecem testes gratuitos e uso baseado em créditos.

Apesar dos recursos avançados, o modelo tem falhas frequentes:

Clipes são curtos — em muitos casos, limitados a 8 segundos.

Movimentos corporais e expressões podem parecer artificiais.

Sons nem sempre acompanham corretamente as ações ou diálogos.

Legendas e textos gerados em cena muitas vezes apresentam erros ou são desconexos.

Ao exportar de ferramentas como Scene Builder, o áudio pode desaparecer, exigindo edição manual.

Segurança, marcação e futuro da IA em vídeo

Todos os vídeos gerados recebem a SynthID, uma marca d’água digital embutida em cada quadro, indicando origem artificial e dificultando manipulações mal-intencionadas.

Mesmo com limitações, o Veo 3 representa um salto técnico na criação audiovisual com IA, unindo geração de imagem e som em uma mesma etapa — e permitindo que, com um bom prompt, qualquer um crie uma cena entre o cinema, o absurdo e o viral.