15 segundos es lo que necesita OpenAI  para clonar tu voz

Las nuevas «inteligencias artificiales» están creando un nuevo futuro donde nos tendremos que plantear que es real y que no. OpenAI inicio la senda y a día de hoy sigue siendo un referente en este campo, dejando muestras de las enormes posibilidades de estas tecnologías, ya no solo a la hora de poder mantener una conversación o generar un contenido en texto, sino también a la hora de generar imágenes, videos e incluso voces hiper realistas.

En un nuevo comunicado OpenAI ha anunciado que su sistema de Voice Engine ha mejorado tanto, que ahora es capaz de clonar y generar voces realistas con una muestra de solo 15 segundos de audio. Es decir que con solo escuchar nuestras voces durante 15 segundos, Voice Engine es capaz de generar voces que prácticamente son idénticas a nuestra voz.

La compañía no se ha limitado a comunicar de palabra este avance, sino que ha dejado un ejemplo de como con un simple mensaje es capaz de generar audios completos.

Audio de referencia

https://one-tech.es/wp-content/uploads/2024/04/age-of-learning-spanish-reference.mp3

Audio generado

https://one-tech.es/wp-content/uploads/2024/04/age-of-learning-spanish-aprendizaje-compartido.mp3
https://one-tech.es/wp-content/uploads/2024/04/age-of-learning-spanish-abc-mouse.mp3
https://one-tech.es/wp-content/uploads/2024/04/age-of-learning-spanish-aprender-espanol.mp3

Esto no solo está disponible en Inglés y español, sino que la compañía ha mostrado audios generados en Mandarín, Alemán, Francés y Japonés.

Si bien OpenAI aún tiene que valorar cuando implementará esta tecnología de forma pública, ya apunta varios usos posibles, como ayudar a los pacientes que sufren problemas de habla degenerativas, a personas con afecciones de habla o incluso como terapía de aprendizaje.

Conscientes de los posible problemas que pueda generar, la compañía ha querido tranquilizar al gran publico. Para ello han anunciado que están trabajando con sus socios para que estos acepten unas políticas de uso , que prohíben la suplantación de una persona u organización sin consentimiento o derecho legal. Además, se requerirá el consentimiento explícito e informado del hablante original y no permitirán que los desarrolladores creen formas para que los usuarios individuales creen sus propias voces. Estas creaciones también deberán revelar claramente que las voces que escuchan están generadas por IA.

Open AI implementará un conjunto de medidas de seguridad, que incluyen marcas de agua para rastrear el origen de cualquier audio generado por Voice Engine, así como el monitoreo de cómo se utiliza.