La nueva IA de OpenAI puede imitar una voz con solo 15 segundos de audio

OpenAI ha desarrollado tecnologías destacadas como ChatGPT y Sora. Ahora, la empresa lanzó su nueva herramienta llamada Voice Engine, una IA que puede replicar tu voz con tan solo 15 segundos de audio.

El logo de OpenAI, en una fotografía de archivo. EFE/EPA/Wu Hao

Aunque aún está en fase de prueba, Voice Engine muestra un gran potencial. Utiliza texto de entrada junto con una breve muestra de 15 segundos de audio para generar habla natural que se asemeja notablemente a la del hablante original.

Esta tecnología promete una amplia gama de aplicaciones, desde la traducción de contenido audiovisual hasta la personalización de experiencias de usuario. Voice Engine ha sido integrado en aplicaciones como la API de conversión de texto a voz, ChatGPT Voice y Read Aloud, pero ahora es capaz de mostrar su verdadero potencial.

Voice Engine conserva los acentos nativos de los hablantes originales, lo que lo hace especialmente útil para la traducción de contenido. Por ejemplo, un hablante francés podría generar habla en inglés con un acento francés.

Sin embargo, su implementación plantea preocupaciones éticas y legales. OpenAI ha establecido medidas para evitar la suplantación de identidad sin consentimiento y requiere el consentimiento explícito del hablante original para su uso. Además, no permite que los desarrolladores creen herramientas para que los usuarios generen sus propias voces, al menos por ahora. Por el momento está en fase de prueba y no se asegura que llegue al público en general.

Tagged OpenAI, Voice Engine

La nueva IA de OpenAI puede imitar una voz con solo 15 segundos de audio

Leave a Reply Cancel reply