La IA revoluciona la comunicación: voces clonadas más claras que las humanas
- Voces clonadas más inteligibles en ambientes ruidosos
- Cómo se crean las voces clonadas
- Experimentos sobre la inteligibilidad de las voces
- Análisis acústicos y próximos pasos
Voces clonadas más inteligibles en ambientes ruidosos
En un estudio realizado por investigadores del University College London y la Universidad de Roehampton, ambos en Reino Unido, se descubrió que las voces clonadas resultan más fáciles de comprender que las voces humanas naturales cuando hay ruido de fondo. Este hallazgo fue publicado en la revista 'JASA', editada por AIP Publishing para la Acoustical Society of America.
El trabajo evaluó la claridad de las voces humanas frente a las clonadas, variables muy presentes en tecnologías de audio actuales. La creciente integración de voces sintéticas en dispositivos cotidianos plantea nuevos interrogantes sobre su eficacia y comprensión, especialmente en entornos con ruido ambiental.
Cómo se crean las voces clonadas
Las voces clonadas se distinguen de las sintéticas tradicionales por la eficiencia en la recolección de datos de voz. Mientras asistentes digitales convencionales requieren largas sesiones de grabación con actores de voz, las voces clonadas pueden generarse a partir de solo 10 segundos de audio de la persona a replicar.
Esta diferencia permite una rápida expansión en la creación de voces personalizadas, lo que aumenta las posibilidades de uso para aplicaciones que van desde asistentes personales hasta sistemas automatizados de servicio al cliente.
Experimentos sobre la inteligibilidad de las voces
Los investigadores Patti Adank y Han Wang, especialistas en la percepción del habla poco clara, exploraron si las voces clonadas serían fáciles de entender para el público general. Partían de la hipótesis de que estas réplicas tendrían menor comprensión debido a su naturaleza artificial y desconocida.
Sin embargo, los resultados sorprendieron: las voces clonadas mostraron hasta un 20% más de inteligibilidad que las voces humanas naturales. Para confirmar estos hallazgos, realizaron pruebas con diferentes grupos, incluidos adultos mayores, hablantes con distintos acentos y perfiles auditivos alterados, verificando que la claridad superior de las voces clonadas se mantenía en todos los casos.
Análisis acústicos y próximos pasos
Luego de revisar más de 100 parámetros acústicos, los investigadores concluyeron que es necesario estudiar en detalle los sistemas de síntesis de voz para identificar qué factores hacen que las voces clonadas sean más claras. Por ello, planean colaborar con expertos en conversión de texto a voz para replicar el efecto observado con un software de clonación de código abierto.
Este enfoque permitirá entender mejor los procesos de procesamiento digital de señales involucrados en la generación de voces y avanzar en la mejora de la inteligibilidad en sistemas de voz sintética.