Respuestas

2012-08-04T05:48:30+02:00

En este trabajo, investigamos el poder predictivo de los diferentes esquemas de descomposición en factores prosódicos con respecto al movimiento de tono. Vamos a usar esto para proponer una ampliación de una base de datos estándar con difonos difonos que se han registrado en diferentes contextos prosódicos. El objetivo de esta investigación es reducir la cantidad de modificación de tono necesario, mejorando así la calidad segmentaria de la voz sintética. Vamos a presentar un esquema basado en factorización de la estructura del pie de los enunciados y mostrar que este esquema eficiente resulta en un número bastante reducido de difonos adicionales que necesitan ser registradas.