Tendencias

Voice Engine, la nueva IA que clona voces

Javiera Sanzana

OpenAI ha introducido Voice Engine, una innovadora aplicación de Inteligencia Artificial (IA) que permite replicar la voz de las personas a partir de una breve muestra de audio de 15 segundos.
En función de los resultados de estas pruebas y de este diálogo, OpenAI tomará decisiones sobre futuras implementaciones de esta tecnología.

OpenAI ha introducido Voice Engine, una innovadora aplicación de Inteligencia Artificial (IA) que permite replicar la voz de las personas a partir de una breve muestra de audio de 15 segundos.

Este modelo no solo puede imitar la voz de un individuo, sino que también es capaz de convertir texto en voz en múltiples idiomas, ofreciendo resultados sorprendentemente naturales.

El desarrollo de Voice Engine comenzó a finales de 2022 con el objetivo de crear voces personalizadas a partir de una única muestra de audio breve y texto de entrada.

VOICE ENGINE

Actualmente, Voice Engine es un modelo a pequeña escala que ha sido empleado para mejorar las voces preexistentes en la API de conversión de texto a voz, así como en aplicaciones como ChatGPT Voice y Read Aloud.

Además de su aplicación práctica, Voice Engine ha sido desarrollado como un proyecto de investigación para explorar sus diversos usos potenciales.

OpenAI ha compartido una vista previa de este modelo con colaboradores de confianza para recopilar comentarios y observaciones.

VOCES EMOTIVAS Y REALITAS

Los resultados preliminares indican que Voice Engine puede generar voces emotivas y realistas utilizando únicamente una breve muestra de audio de 15 segundos del hablante original.

Esta capacidad tiene aplicaciones variadas, como proporcionar lecturas personalizadas en tiempo real para el ámbito educativo y facilitar la traducción de contenido multimedia manteniendo el acento nativo del hablante.

Además, Voice Engine se ha identificado como una herramienta valiosa en entornos laborales, desde marketing hasta presentaciones de ventas, ofreciendo la posibilidad de crear contenido en varios idiomas.

ÁMBITO DE LA SALUD

En el ámbito de la salud, Voice Engine puede tener aplicaciones terapéuticas para ayudar a personas con afecciones del habla, facilitando la comunicación y el aprendizaje del habla.

Lea también: Tres detenidos por encañonar a Marcianeke en su casa

OpenAI reconoce los riesgos asociados con la implementación generalizada de voces sintéticas y ha tomado medidas de seguridad, como políticas de uso y obtención de consentimiento explícito del hablante original.

APLICACIÓN ÉTICA Y RESPONSABLE EN LA SOCIEDAD

La compañía está colaborando con diversos sectores para evaluar de manera responsable el uso y despliegue de voces sintéticas, con el objetivo de iniciar un diálogo sobre su aplicación ética y responsable en la sociedad.

En función de los resultados de estas pruebas y de este diálogo, OpenAI tomará decisiones sobre futuras implementaciones de esta tecnología.

Comparte en:

Facebook
Twitter
LinkedIn
WhatsApp
Email

Comenta este artículo

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

16 + 4 =