Tecnologia brasileira pode ajudar no ensino de idiomas

A startup SpeechTera criou software que reconhece fala e produz vozes variadas; pode servir para ensino de idiomas e apoio a pessoas com distúrbios da fala

TECNOLOGIAS DE FALA: a startup SpeechTera está investindo em quatro diferentes produtos na área (Emily Poisel/Flickr)

Mariana Martucci

Publicado em 6 de setembro de 2018 às 11h21.

Última atualização em 6 de setembro de 2018 às 11h50.

Quando Vanessa Marquiafável Serrani ingressou no curso de Licenciatura em Letras na Universidade Federal de São Carlos (UFSCar), em 2000, seu futuro profissional já parecia definido: seria professora de inglês. Mas sua trajetória mudou ainda na graduação, ao conhecer o Núcleo Interinstitucional de Linguística Computacional (NILC) da Universidade de São Paulo, campus São Carlos, durante um projeto de iniciação científica. Acabou trocando a carreira acadêmica pelo empreendedorismo.

Hoje Vanessa Serrani é sócia-proprietária da empresa SpeechTera Desenvolvimento de Programas para Computadores Ltda. e desenvolve, com apoio do Programa Pesquisa Inovativa em Pequenas Empresas (PIPE) da FAPESP, um projeto de criação de recursos computacionais para tecnologias de fala voltadas ao português no Brasil.

O projeto concluiu a fase 1 do PIPE — de teste de viabilidade — em 2016 e está na fase 2 — de desenvolvimento propriamente dito — ,com término previsto para 2019, quando a SpeechTera espera colocar no mercado recursos computacionais essenciais ao desenvolvimento de sistemas para síntese e reconhecimento de fala. A linguista explica que existem diversas aplicações para esse ramo da tecnologia: criação de comandos de voz para dispositivos eletrônicos, aperfeiçoamento de pronúncia na área do ensino de idiomas, tradutores automáticos, sistemas terapêuticos para pessoas com patologias de fala, inclusão digital de pessoas com deficiências visuais ou motoras, entre outras.

Para pessoas que sofrem de distúrbios da fala é possível até criar vozes personalizadas. “A voz constitui traço identitário de um indivíduo”, diz Vanessa. No entanto, por causa do alto custo dos sistemas de síntese de voz desenvolvidos no exterior, as empresas de tecnologia tendem a criar poucos tipos de vozes sintéticas — o que pode causar insatisfação e até rejeição por parte do usuário.

O desenvolvimento de uma tecnologia nacional, reduzindo os custos, pode trazer novas alternativas de vozes customizadas masculinas, femininas e infantis. “É possível, inclusive, extrair traços acústicos de pequenas amostras de fala para construir uma voz sintética personalizada para indivíduos que, dadas as dificuldades motoras, conseguem articular apenas algumas palavras ou até mesmo algumas poucas vogais”, acrescenta a pesquisadora.

Segundo Serrani, o modelo de negócios da SpeechTera será, sobretudo, business-to-business, tendo como clientes empresas desenvolvedoras de serviços baseados em tecnologias de fala, como e-commerce, e-learning e e-banking, além de hospitais, clínicas e centros de saúde.

A SpeechTera está investindo em quatro diferentes produtos: corpora de fala, modelos acústicos, modelos de pronúncia e conversores grafema-fonema. A linguista explica que os corpora (plural do latim corpus, conjunto) são as bases de dados de voz utilizadas pelos sintetizadores. “Coletamos vozes de pessoas entre 18 e 65 anos, de diversos perfis e sotaques brasileiros. Assim, quanto maior a variabilidade, melhor poderá ser o desempenho de um reconhecedor de fala.”

Modelos acústicos são responsáveis por determinar as características acústicas dos fonemas da língua. Os modelos de pronúncia são os dicionários fonéticos, listas de palavras às quais são associadas suas respectivas pronúncias, de acordo com um alfabeto fonético legível pelo computador.

“Esses dicionários são transcritos conforme 13 diferentes sotaques brasileiros que elegemos dentre a enorme variedade existente no país”, explica Serrani. E o conversor grafema-fonema é o algoritmo que transforma o texto de entrada que está no formato ortográfico convencional numa sequência de símbolos fonéticos tratáveis por computador. Segundo a pesquisadora, esses produtos poderão ser comercializados de forma individual ou separadamente.

Acompanhe tudo sobre:Tecnologia da informação Agência Fapesp Comunicação

Professor de português ensina segredo para falar e escrever bem

Mais de Tecnologia

Como usar o ChatGPT para analisar contratos

Mais na Exame

Imagem referente à matéria: Estádios da Copa: Hard Rock Stadium já recebeu final da Copa América

Esporte

Tecnologia

Tecnologia brasileira pode ajudar no ensino de idiomas

A startup SpeechTera criou software que reconhece fala e produz vozes variadas; pode servir para ensino de idiomas e apoio a pessoas com distúrbios da fala

Mais de Tecnologia

Como usar o ChatGPT para analisar contratos

Computex 2026 deve marcar chegada de notebooks com IA mais baratos

Computex 2026 mostra que corrida da IA depende menos de chatbots e mais de infraestrutura

IA virou o novo Google da Geração Z?

Mais na Exame

Estádios da Copa: Hard Rock Stadium já recebeu final da Copa América

Espriella, aliado de Bolsonaro, tem maioria dos votos no 1º turno da Colombia

Petrobras reduz preço do litro do diesel a distribuidoras em R$ 0,35

EUA fecham brecha que poderia levar chips da Nvidia à China; entenda