Em uma realização inovadora, uma mulher com paralisia grave conseguiu “falar” em tempo real usando apenas sinais cerebrais, captados por um chip. A conquista foi fruto de um estudo colaborativo entre as universidades de Berkeley e de San Francisco, ambas nos Estados Unidos, que desenvolveram uma interface cérebro-computador capaz de traduzir a atividade neural em palavras e gerar voz simultaneamente.
Este estudo supera um dos maiores desafios enfrentados pelas tecnologias mais avançadas na área: a demora entre a decodificação dos pensamentos e a produção de som em pessoas com paralisia. A nova técnica oferece uma comunicação mais fluida e natural do que os métodos anteriores, permitindo uma interação mais dinâmica.
Como Funciona a Conversão dos Sinais Cerebrais em Fala?
A neuroprótese implantada na paciente Ann, cuja identidade foi preservada, capta sinais do córtex motor – a região do cérebro responsável pelo controle da fala. Esses sinais são então traduzidos em palavras por meio de modelos de linguagem. O processo funciona de maneira semelhante a um ditado, no qual Ann repete as sugestões da máquina para treinar o algoritmo.
Para treinar o sistema, a equipe de pesquisadores utilizou dados de Ann enquanto ela tentava mentalmente pronunciar frases, assistindo a prompts em uma tela. “Interceptamos os sinais que indicam o momento em que o pensamento se transforma na articulação dos músculos da fala, e os interpretamos”, explica um dos coautores do estudo. “Decodificamos o que acontece depois que o pensamento se forma, após decidirmos o que dizer, quais palavras usar e como movimentar os músculos vocais”, completa.
Para recriar a voz original de Ann, os pesquisadores usaram gravações feitas antes da lesão cerebral para desenvolver modelos de voz que fizessem a reprodução sonora mais fiel possível. “Isso permite que o sistema gere uma voz semelhante à dela, ajudando-a a se identificar”, afirmam os cientistas.
Avanço em Velocidade e Precisão
Nos testes iniciais, o processo de decodificação levava até oito segundos por frase. Com a nova tecnologia, no entanto, a fala é gerada em menos de um segundo após a intenção de falar. “Dentro de um segundo, temos o primeiro som. O dispositivo também permite uma decodificação contínua, o que significa que Ann pode falar sem interrupções”, afirma outro autor do estudo.
Apesar da redução no tempo de espera, a precisão do sistema foi mantida, com altas taxas de acerto mesmo quando palavras novas eram utilizadas. Ann relatou que a experiência com a nova técnica foi mais intuitiva, e destacou que ouvir sua própria voz em tempo quase real aumentou a sensação de corporeidade. “Nossas avaliações indicam que esse retorno sensorial melhora a percepção de sua identidade”, acrescentam os pesquisadores.
O próximo objetivo é aprimorar ainda mais o sistema, incorporando variações de tom e emoção, o que tornará a fala mais expressiva e próxima da naturalidade.
O Futuro da Comunicação para Pessoas com Paralisia
A tecnologia desenvolvida é compatível com diversos métodos de captura neural, incluindo tanto eletrodos invasivos quanto sensores não invasivos. Esse avanço abre novas possibilidades para aplicações práticas, como dispositivos comunicativos portáteis. “Essa inovação tem o potencial de melhorar significativamente a qualidade de vida de pessoas com paralisia severa”, destaca, um dos principais pesquisadores do estudo.
Com ajustes contínuos, a técnica pode não apenas devolver palavras, mas também recriar a voz única de cada indivíduo – um passo essencial para restaurar a autonomia e a conexão humana para aqueles que perderam a capacidade de falar devido a lesões ou condições neurológicas.