Inteligência Artificial

Fotos ganham vida, e realismo, em nova ferramenta da Microsoft que sicroniza áudio e movimentos

Novo modelo de inteligência artificial da Microsoft, o VASA-1, permite animar rostos e artes com movimentos e expressões realistas

André Lopes
André Lopes

Repórter

Publicado em 18 de abril de 2024 às 17h44.

Última atualização em 18 de abril de 2024 às 17h44.

Pesquisadores da Microsoft Research Lab, localizado em Pequim, China, introduziram na quarta-feira, 17, o VASA-1, um novo modelo de inteligência artificial capaz de criar vídeos realistas em tempo real, animando rostos humanos a partir de apenas uma foto e um clipe de áudio.

O VASA-1 permite a geração de vídeos curtos com movimentos e expressões faciais altamente convincentes, incluindo sincronização labial, que podem facilmente enganar espectadores desatentos.

Além de rostos humanos, o modelo também anima personagens fictícios e obras de arte, adicionando falas em diferentes idiomas e até cantorias.

O modelo oferece ao usuário amplo controle sobre os vídeos gerados, permitindo ajustar expressões faciais, direção do olhar e outros parâmetros em tempo real. Os vídeos alcançam uma resolução de 512x512 pixels e podem ser produzidos a uma taxa de até 40 quadros por segundo.

A equipe, consciente dos potenciais riscos associados ao uso indevido da tecnologia, como a criação de deepfakes, afirmou que a comercialização do VASA-1 só ocorrerá após garantias de uso responsável e conforme regulamentações vigentes.

Acompanhe tudo sobre:MicrosoftInteligência artificial

Mais de Inteligência Artificial

Você é você? Como essa unicórnio da Estônia usa IA para driblar deepfakes e outras falsificações

xAI vai superar a OpenAI? Empresa de Musk capta R$ 36 bi e desafia gigantes do setor

ChatGPT e 'David Mayer': o mistério do nome que a IA não reconhece

Projeto de regulamentação de IA no Brasil é aprovado em comissão no Senado e plenário analisa texto