Qué es Voice Engine, la nueva inteligencia artificial de OpenAI que puede clonar tu voz

Voice Engine, la nueva inteligencia artificial de Sam Altman, puede generar un habla con sonido natural para proporcionar asistencia de lectura, traducir contenido o mejorar la prestación de servicios en entornos remotos.
Imagen creada por una IA.
Imagen creada por una IA.
DALL-E via Bing Image Creator
Imagen creada por una IA.

OpenAI, la empresa de Sam Altman, se hizo popular en España con la llegada de ChatGPT en noviembre de 2022. Pero más allá de este chatbot con inteligencia artificial (IA), dicha entidad decidió ampliar su abanico de tecnologías y, en febrero de este año, lanzó Sora, una IA capaz de crear vídeos de hasta 60 segundos a partir de texto.

No obstante, para seguir creciendo a nivel empresarial y destacar en el ámbito de la inteligencia artificial, OpenAI presenta su nuevo proyecto llamado Voice Engine, un modelo que utiliza entrada de texto y una única muestra de audio de 15 segundos para generar un habla con sonido natural que se parece bastante al hablante original.

Desde 20Bits te explicamos qué es esta tecnología, cómo funciona, cuándo estará disponible y qué riesgos o peligros supone para el ser humano.

Qué es Voice Engine

Voice Engine es una inteligencia artificial que, con tan solo escuchar una voz durante 15 segundos, es capaz de crear una copia sintética de dicha voz, imitando su tono.

OpenAI desarrolló por primera vez Voice Engine a finales de 2022 y lo utilizó para potenciar voces preestablecidas disponibles en la API de conversión de texto a voz, así como ChatGPT Voice y Read Aloud. Desde entonces, la empresa de Sam Altman está adoptando un enfoque cauteloso e informando para una "publicación más amplia debido al potencial de uso indebido de la voz sintética".

Y de cara a un futuro, OpenAI espera "iniciar un diálogo sobre el despliegue responsable de voces sintéticas y cómo la sociedad puede adaptarse a estas nuevas capacidades", así pues, con base en estas conversaciones, tomará una "decisión más informada sobre si implementar esta tecnología a escala y cómo hacerlo".

Cómo se usa Voice Engine

Para usar esta inteligencia artificial basta con una entrada de texto con la descripción de lo que deseamos y una muestra de audio de 15 segundos para crear un clip. Y, una vez hechos todos estos pasos, Voice Engine creará una voz similar a la humana.

Por otro lado, respecto a sus usos, OpenAI explica en su blog oficial que Voice Engine puede proporcionar asistencia de lectura, traducir contenido, mejorar la prestación de servicios en entornos remotos, ayudar a pacientes a recuperar su voz o apoyar a personas que no usen la comunicación verbal, entre otros.

¿Qué opinas sobre la regulación de la Inteligencia Artificial por parte de la Unión Europea?

Cuándo estará disponible Voice Engine

Voice Engine todavía no está disponible para los usuarios, sin embargo, OpenAI ha decidido hacer una vista previa de esta tecnología en su blog oficial para destacar su potencial.

Muestras de Voice Engine en el blog oficial de OpenAI.
Muestras de Voice Engine en el blog oficial de OpenAI.
OpenAI

Las medidas de seguridad de OpenAI

En el comunicado del blog oficial, OpenAI afirma que "los socios que prueban Voice Engine aceptan nuestras políticas de uso, que prohíben la suplantación de otra persona u organización sin consentimiento o derecho legal. Además, nuestros términos con estos socios requieren el consentimiento explícito e informado del hablante original y no permitimos que los desarrolladores creen formas para que los usuarios individuales creen sus propias voces. Los socios también deben revelar claramente a su audiencia que las voces que escuchan están generadas por IA. Finalmente, hemos implementado un conjunto de medidas de seguridad, que incluyen marcas de agua para rastrear el origen de cualquier audio generado por Voice Engine, así como un monitoreo proactivo de cómo se utiliza".

Apúntate a nuestra newsletter y recibe en tu correo las últimas noticias sobre tecnología.

Mostrar comentarios

Códigos Descuento