Tecnologia permitiu traduzir quase o dobro da média de palavras por minuto, 8 vezes mais rápido que os métodos para fala anteriores
Após quase duas décadas sem falar devido a um derrame cerebral aos 30 anos, uma mulher de 47 anos recuperou a habilidade nos EUA. Com um novo software de implante neural, ela é capaz de transformar seus pensamentos em palavras em tempo real.
A tecnologia analisa sua atividade cerebral em 80 milissegundos e a traduz em uma versão sintetizada de sua voz. O engenheiro de computação Kaylo Littlejohn, da Universidade da Califórnia, nos EUA, liderou a pesquisa. A revista Nature Neuroscience publicou o artigo na última segunda-feira (31).
O novo método corrigiu o atraso das versões anteriores, que afetava negativamente a comunicação. Isso porque a maioria dos recursos anteriores exige o processamento de um pedaço de texto completo antes da vocalização, atrasando a fala e a tornando antinatural. Além disso, a maioria dos métodos depende da tentativa do participante de falar, o que pode ser um desafio para quem tem dificuldade para falar.

No entanto, novos projetos demonstraram avanços na redução do tempo para gerar fala. De acordo com os pesquisadores, “melhorar a latência da síntese da fala e a velocidade de decodificação é essencial para uma conversa dinâmica e uma comunicação fluente”. Isso é “agravado pelo fato de que a síntese de fala exige tempo adicional para ser reproduzida e para que o usuário e o ouvinte compreendam o áudio sintetizado”, completaram.
Como mulher voltou a “falar” com implante neural
Para desenvolver a tecnologia, os pesquisadores treinaram uma rede neural flexível e de aprendizado profundo na atividade do córtex sensório-motor da participante enquanto ela pensava em 100 frases de um vocabulário de cerca de mil palavras. Eles ainda usaram uma forma de comunicação assistida baseada em 50 frases usando um conjunto menor de palavras.
O sistema decodificou a comunicação, traduzindo quase o dobro da média de palavras por minuto que os métodos anteriores. O dispositivo também foi capaz de interpretar sinais neurais com palavras não treinadas.
Além disso, usar um método preditivo contínuo fez com que a fala fluísse 8 vezes mais rapidamente. Gravações passadas também ajudaram a fazer com que o programa replicasse a voz corretamente. Portanto, os autores acreditam que a tecnologia seja clinicamente viável, apesar da possibilidade de se desenvolver mais.
Por: Isabela Oliveira