Inteligência artificial imita voz humana com amostra de apenas 1 minuto
Se você viu a apresentação do Google, na qual o Assistente fez chamadas de voz para pessoas reais, sabe que isso pode causar polêmica
Lucas Agrela
Publicado em 13 de junho de 2018 às 05h55.
Última atualização em 13 de junho de 2018 às 05h55.
São Paulo – Baseada no Canadá, a Lyrebird é uma startup de inteligência artificial que desenvolveu um algoritmo capaz de imitar a voz humana com amostras breves da voz de uma pessoa. Um minuto já pode ser o suficiente para que uma simulação seja criada–ainda que áudios de algumas horas gerem resultados mais eficazes.
Se você viu a apresentação do Google, na qual o Google Assistente fez chamadas de voz para pessoas sem se identificar como um recurso artificial, sabe que isso pode causar polêmica. A primeira coisa que vem à mente, provavelmente, é o uso indiscriminado dessa tecnologia, que poderia fazer você falar com robôs ao telefone sem saber que não há uma pessoa real do outro lado da linha.
Porém, a startup diz que o recurso pode ser usado para a criação de vozes para chatbots de atendimento ao cliente ou até para dar vozes a personagens de videogame. A companhia tem até uma parceria com a ALS Association, organização sem fins lucrativos que arrecada fundos para pacientes com ELA (esclerose múltipla amiotrófica), para ajudar pessoas com a doença a se comunicar.
Para demonstrar sua tecnologia, a Lyrebird divulgou um áudio com vozes simuladas de Donald Trump, Barack Obama e Hillary Clinton conversando sobre a tecnologia da empresa. Ouça-o a seguir.
Em vídeo da Bloomberg, o jornalista Ashlee Vance tem sua voz copiada e realiza uma ligação para sua mãe, que não percebe estar falando com um robô. Veja-o a seguir. A reportagem continua em seguida.
Os fundadores da Lyrebird, três estudantes da Universidade de Montreal, afirmam que sua tecnologia levanta pontos importantes para a sociedade, incluindo questionamentos sobre a autenticidade de áudios usados como provas judiciais. A solução que a empresa propõe é tornar sua tecnologia "acessível a todos". Como um Photoshop para voz, os fundadores esperam que, assim como sabemos que pode acontecer hoje com as fotos, as pessoas saberão que áudios também podem ser falsificados.
O número de idiomas disponíveis ainda é limitado. Nem mesmo o francês, falado no Canadá, está disponível na plataforma da Lyrebird. O algoritmo só lida bem com o inglês americano no momento.
A tendência de usar inteligência artificial para voz já é um caminho sem volta. Além de Google e de startups, a Adobe também conta com uma solução para isso. O projeto é chamado Project VoCo e permite editar vozes humanas como editamos imagens no Photoshop. Ainda assim, a amostra necessária de áudio é de 20 minutos, que mostra potencial do algoritmo da startup canadense–apesar de que alguns exemplos soem ainda um tanto robóticos. Outro exemplo dessa tendência da voz entre as empresas de tecnologia é o recurso de guia curva a curva no Waze que usa a voz do próprio usuário, algo que já foi descrito como uma selfie para os seus ouvidos.
A Lyrebird garante, em seu site oficial, que a sua voz digital é somente sua e ninguém mais pode usá-la sem seu consentimento. De qualquer forma, você pode gravar seu um minuto de áudio no site, após um login com e-mail comercial, e ouvir sua voz robótica. Todos os dados podem ser apagados depois que você fizer o teste. Se quiser ouvir sua voz imitada pelo algoritmo da Lyrebird, é possível fazer isso neste link.