La Jornada: Crean en la UNAM software que sintetiza voz en español mexicano con tres tonos

Buscan llevar esta tecnología a celulares como aplicación para traducciones

Crean en la UNAM software que sintetiza voz en español mexicano con tres tonos

Puede ser de hombre o de mujer y es capaz de simular tristeza, enojo y felicidad

De la Redacción

Periódico La Jornada
Lunes 30 de diciembre de 2013, p. 34

Académicos de la Facultad de Ingeniería, de la Universidad Nacional Autónoma de México (UNAM), crearon un software para sintetizar voz en español mexicano, que permite generarla a partir de un texto, no sólo de manera neutral, pues es capaz de simular tres tonos emocionales: felicidad, tristeza y enojo.

Según José Abel Herrera Camacho, responsable del Laboratorio de Procesamiento de Voz, quien encabeza este grupo de expertos, el objetivo principal del programa es que en los sonidos emitidos no se distinga si se trata de una persona o de una máquina.

Explicó que este programa de cómputo puede seleccionar voz de hombre o de mujer al momento de generar la salida.

En su elaboración se produjeron dos conjuntos de grabaciones, hombre y mujer, que contienen frases obtenidas al azar de diferentes textos, leídas en los estados de ánimo a generar. Hasta el momento han desarrollado los tres tonos emocionales antes mencionados.

A partir de esas grabaciones, explicó Herrera Camacho, el algoritmo aprende las características lingüísticas de los fonemas insertos en las emociones y las reproduce para cualquier otra palabra.

El tono y duración de cada fonema se manejan de forma independiente, por lo que al momento de la síntesis se pueden simular de mejor manera las emociones, al modificar cada sonido para que embone lo más similar posible en su contexto, con lo que es posible mejorar la calidad del audio de salida, explicó.

En ese laboratorio, abundó, ya se han realizado pruebas de interacción con voz en una laptop, sin necesidad de usar el teclado, lo que implica mayor comodidad al usuario.

La finalidad de esta tecnología es llevarla a los teléfonos celulares como una aplicación que permita a los usuarios hacer traducciones en un futuro. Si se viaja a Japón, por ejemplo, se hablaría al móvil en español y éste haría la traducción al japonés y viceversa, para facilitar una intercomunicación en países cuya lengua no sea la nuestra, indicó el universitario.

Mencionó que las aplicaciones del sintetizador de voz podrían emplearse en cuestiones del hogar, como en el encendido de la televisión, para indicar el volumen requerido y el canal de preferencia. También sería útil en las lavadoras, que nos indiquen si se requiere más detergente, por ejemplo. Ésta es una interacción hombre-máquina que puede usarse en todos lados; de hecho, ya se aplica en autos.

Agregó que los algoritmos que se utilizan en pruebas son diseñados en el Laboratorio de Procesamiento de Voz.

A nterior

S iguiente

Subir al inicio del texto

Inicio	Editorial	El Correo Ilustrado	Opinión	Política	Economía	Mundo	Estados
Capital	Sociedad y Justicia	Deportes	Cultura	Espectáculos		Cartones