Nueva Hampshire.— Jessie Levine sonríe maravillada cada vez que escucha el saludo programado en la contestadora de su teléfono celular. “íSueno como si fuera joven y hablara normal!”, dice. “Esa persona nunca pensó que su voz sonaría así”.
El mensaje fue grabado antes de que Levine fuera diagnosticada con esclerosis lateral amiotrópica, conocida como la enfermedad de Lou Gehrig, a comienzos de 2015, que la dejó con dificultades para hablar.
Sin embargo, ahora está experimentando con una nueva tecnología: la síntesis de voz, que consiste en la producción artificial de la voz humana.
La tecnología ha existido desde hace décadas, pero a medida que los dispositivos electrónicos se hacen más pequeños, proliferan los intentos para ofrecer voces a la medida.
Hay varias compañías e institutos científicos que están elaborando voces sintetizadas a partir de muestras de voz, usando miles de frases grabadas.
Por ejemplo, CereProc, con sede en Edimburgo, Escocia, creó una voz para Roger Ebert, el cronista de cine que falleció en 2013, usando frases que él había grabado para las películas.
Sin embargo, VocaliD, una compañía con sede en Belmont, Massachusetts, está usando otra técnica que se basa en muestras breves de la voz del cliente, aun si tiene dificultades para hablar.
Con apenas un segmento breve de la voz de una persona —por ejemplo, unos segundos diciendo “Ahhhh”— la compañía puede acoplar la voz del cliente con la de un “donante” —en el caso de Levine, quizás la voz de un familiar— a fin de combinar las dos.
El resultado es un archivo de audio que puede ser aplicado por cualquier dispositivo de reconocimiento de voz. “Tengo dos hermanas, una de las cuales habla con un ceceo igual que yo, algo que yo tenía antes de enfermarme. Y la otra tiene, al igual que las otras dos, una forma de hablar algo rígida”, expresó Levine, de 45 años y alcaldesa del condado de Sullivan en Nueva Hampshire.
“Jamás se me ocurrió que iba a usar sus voces, adaptarlas a la mía y usarlas para tener mi propia voz”.
Rupal Patel, la fundadora y directora de la compañía, es profesora de tecnologías de voz que está de licencia en la Northeastern University.
En sus investigaciones halló que gente con profundas discapacidades para hablar conservan algún control sobre su voz, como el volumen o el tono.
Esas características —que Patel llama “la melodía de la voz”— son importantes también para desarrollar una voz singular, expresó.
“Hay cierto nivel de confianza que viene con la capacidad de comunicarse con su propia voz y eso es algo muy importante que yo creo ha sido ignorado”, señaló Patel.
Nadie daría a una niña una prótesis de una pierna adulta y lo mismo se debería aplicar para las voces, comentó.
La compañía despachó sus primeras siete voces a fines del año pasado y está desarrollando otras 84, a un precio de 1.249 dólares cada una. Más de 14.000 personas alrededor del mundo han donado sus voces en un proceso que dura unas seis horas y la grabación de unas 3.500 oraciones.
Uno de los primeros usuarios fue Delaney Supple, de 17 años y de Needham, Massachusetts, que nació con parálisis cerebral.
Hasta ahora ella estaba usando una voz artificial genérica pero no le agradaba mucho. Cuando su madre la menciona, ella hace una mueca de disgusto.
Algunos dispositivos de voz son controlados con el movimiento de las pupilas de los ojos o de la cabeza.
Delaney Supple escribe las palabras en una tableta y al tocar un comando se convierten en audio.
A Delaney le encanta su nueva voz. Lo mismo a su madre, Erica Supple, quien dijo que es más similar a la voz natural.
“Me encanta escucharla”, expresó, “y lo curioso es que la primera vez que la escuché me sonó como la voz de su hermano cuando él era más chico”.