Desde que, hace muchos años, escuché hablar a HAL 9000, me ha interesado el tema de la síntesis de voz. Cuando, a principios de los 90, compré mi primera tarjeta de sonido, una Sound Blaster Pro de Creative Labs, descubrí que venía acompañada de un programa que, con mayor o menor fortuna, leía en voz alta un texto escrito.
El programa esperaba que el texto estuviese en inglés, por lo que si se introducía en castellano el resultado era, cuando menos, simpático. Había que jugar un poco con el texto, modificándolo ligeramente, para conseguir un resultado más o menos aceptable.
Siendo como soy, me cuesta una barbaridad deshacerme de cualquier ejemplar de hardware que supuestamente funcione. Sin embargo, hay dos cosas a las que he perdido la pista a lo largo de los años: mi ZX Spectrum, con sus espectaculares 16 KB de RAM y teclado de membrana, y la protagonista de esta historia, mi primera Sound Blaster.
Según fue pasando el tiempo, esperaba los lógicos avances en este campo. Hoy en día nos encontramos ejemplos a diario, bien con sistemas con frases pregrabadas, como en los aeropuertos («dipartiur of flait aibiria…«) o el metro («próxima estación, esperanza«), o sistemas más avanzados en las centralitas de los servicios de atención telefónica de cualquier banco o gran empresa. Día a día los sistemas de generación de voz van superándose, y probablemente llegue un momento en el que sus resultados sean indistinguibles de la voz de cualquier persona.
Pues va a ser que no…
Ayer he recibido el «Kit ADSL Router inalámbrico» de Telefónica. En lugar de la típica carta en la que se indican los datos de conexión de la línea (usuario, contraseña, DNS, etc.), en la caja viene una etiqueta (que recomiendan pegar en un lugar visible :) con un número de teléfono al que hay que llamar para obtener los datos de configuración ADSL. Una vez en contacto con dicho número, te responde un programa sintetizador de voz, que pacientemente te dicta tus datos de conexión. Y digo bien, pacientemente, puesto que es necesario indicarle que repita una y otra vez los datos, hasta que tienes más o menos (más bien menos) claro qué es lo que te está diciendo. La calidad es simplemente lamentable y a todas luces insuficiente para el uso al que está destinado y, a lo que iba, me recuerda una barbaridad al sintetizador de voz de mi perdida Sound Blaster.
Desde luego, la comparación con demostraciones como ésta, de Loquendo, no tiene color. Otras posibilidades, obtenidas en cinco minutos con Google, son ésta, ésta, o incluso ésta.
Señores de Telefónica, por favor, devuélvanme mi Sound Blaster.