LAS VEGAS — Filmes dublados costumam causar um certo estranhamento. Apesar de úteis para uma grande parte da população brasileira, as dublagens dão uma sensação de desconforto: é no mínimo esquisito ver Tom Cruise mexer a boca de um jeito, enquanto o som que "sai pela boca" do ator é totalmente diferente.

É um detalhe dos filmes que a população mundial teve que se acostumar, mas não precisa mais. Hoje, com a inteligência artificial, startups como a indiana Neural Garage estão transformando como o mundo consome conteúdo dublado.

De Bengaluru, polo de tecnologia da Índia, a startup oferece uma tecnologia de dublagem visual que soluciona o problema da falta de sincronia entre a voz e quem aparece na tela.

Enquanto os deepfakes costumam ser feitos sem o consentimento da pessoa e com baixa qualidade das imagens, o "VisualDub" foi feito com cuidado para não incomodar o ator, o consumidor final e a empresa por trás.

"É bastante natural. Não é só a boca que mexe quando falamos, mas também o queixo, os ombros, o pescoço, o pomo de Adão...", diz.

A Neural Garage opera com um modelo B2B, atendendo principalmente estúdios de cinema, plataformas de streaming e empresas de publicidade, e está na busca por um investimento de US$ 7 milhões para expandir. Até o momento, a empresa já conquistou US$ 1,45 milhão.

A tecnologia é licenciada para empresas de pós-produção, como as especializadas em VFX e dublagem, permitindo que as marcas criem conteúdos que se alinhem com os idiomas e as preferências de cada público, sem a necessidade de custos de produção elevados.

Como surgiu a ideia?

Durante a pandemia do coronavírus, os cofundadores da Neural Garage estavam em casa, consumindo uma quantidade massiva de conteúdo em várias línguas.

Um dos cofundadores, fã de filmes coreanos e com experiência em tecnologia, se incomodou com a falta de sincronia entre os movimentos labiais dos atores e o áudio dublado.

Já o presidente e cofundador Mandar Natekar trabalhou por décadas em empresas de entretenimento, como as sedes da Índia da HBO e da MTV.

Ao longo dos anos, ele viu o setor tentar resolver esse problema, mas sempre sem sucesso. A solução, ele acreditava, era tecnológica.

“Não podemos fazer o Tom Cruise falar português, mas podemos fazer a tecnologia garantir que ele pareça falar no idioma correto,” explica Natekar.

Como ela funciona?

A tecnologia de dublagem visual da Neural Garage é alimentada por IA avançada que mapeia fonemas (unidades acústicas de fala) com os visemas (movimentos faciais correspondentes a esses sons).

De forma simples, a IA correlaciona o som que está sendo emitido com o movimento da boca. Independente da língua falada, qualquer ser humano vai mexer a boca do mesmo jeito ao falar "ão", "tia" e todas as outras conjunções de sons.

O grande desafio era garantir que o uso da tecnologia não alterasse a imagem original do ator. O sistema da Neural Garage trabalha para preservar a resolução e a aparência dos rostos dos atores, evitando que a IA deixe qualquer tipo de distorção visível.

Isso foi uma preocupação crítica, pois a indústria de entretenimento não aceitava mudanças no rosto dos atores durante o processo de dublagem, o que poderia comprometer a aprovação por parte dos estúdios e dos próprios artistas.

Casos de sucesso

A tecnologia foi testada em campanhas publicitárias com grandes marcas na Índia, como Amazon, Coca-Cola e HP. "Quando eles vêm para a Índia com um comercial em inglês, precisa ser traduzido para quinze línguas", explica Natekar. "É um custo muito alto para gravar tudo em várias línguas, e a dublagem não natural afasta o consumidor".

Segundo o indiano, as marcas perceberam que os anúncios tinham uma taxa de retenção significativamente maior com a dublagem da Neural Garage. Isso resulta numa maior afinidade com a marca e consequentemente em mais vendas.

Trocar o "B" pelo "H"

Com o sucesso em Bollywood, a Neural Garage está pronta para conquistar o mercado global, com um foco especial em Hollywood.

A Neural Garage foi uma das selecionadas para participar da aceleradora da Amazon Web Services (AWS), focado em inteligência artificial generativa.

Para Natekar, a indústria de entretenimento americana é o “destino final” para a Neural Garage. A empresa passará os próximos meses em Miami para mostrar o produto para estúdios e plataformas de streaming.

A startup está levantando uma nova rodada de investimentos de US$ 7 milhões, que será usada para expandir sua presença internacional e lançar seu produto como uma plataforma de licença disponível para download, como, por exemplo, o Adobe Premiere.

Isso permitirá que os estúdios de cinema e as plataformas de streaming integrem a tecnologia diretamente em seu fluxo de trabalho de pós-produção.

*A jornalista viajou a convite da Amazon Web Services (AWS)