YouTube lo deja claro: no quiere que OpenAI use sus vídeos para entrenar a Sora

La sospechas sobre que OpenAI podría estar utilizando a YouTube para entrenar a Sora crecieron tras una entrevista realizada a Mira Murati, la CTO de OpenAI.
Una IA observando un video de YouTube.
Una IA observando un video de YouTube.
DALL-E via Bing Image Creator
Una IA observando un video de YouTube.

La empresa especializada en inteligencia artificial, OpenAI, ya cuenta con un modelo de lenguaje grande como ChatGPT; un generador de imágenes, DALL-E; y una herramienta que transcribe audios a texto, Wishper. La última en unirse fue Sora, que es capaz de transformar una petición textual en vídeos.

Esta IA todavía no está disponible, pero hay unos rumores que afirman que ha utilizado a YouTube para entrenarse, y aunque nadie ha podido confirmarlo, el CEO de YouTube, Neal Mohan, ha advertido a Sam Altman, CEO de Open AI, que sí usan sus vídeos estarán rompiendo las reglas.

¿YouTube para entrenar a Sora?

Esta advertencia se puede llegar a entender, ya que OpenAI no ha aclarado nunca de manera directa lo que ha utilizado para entrenar a su nueva inteligencia artificial. En una entrevista a Bloomberg, el CEO de YouTube dice que entrenar a modelos de IA extrayendo vídeos de la plataforma es una violación a sus términos de uso, aunque no conoce de primera mano que esto hubiera sido así.

En relación con esto, Mohan dice que hay cierto contenido de YouTube como el nombre de canal o en el título del vídeo que están expuestos en scraping (raspado web) para que puedan aparecer en los motores de búsqueda, pero los términos de uso no permiten la descarga de los vídeos ni sus transcripciones.

La sospechas sobre que OpenAI podría estar utilizando a YouTube para entrenar a Sora aumentaron considerablemente después de una entrevista realizada a Mira Murati, la CTO de la compañía de inteligencia artificial, en el The Wall Street Journal, ya que al preguntarle esta posibilidad respondió textualmente: “No estoy segura de eso”.

Sam Altman solamente ha hecho referencia a que utilizan información disponible públicamente de contenidos licenciados, pero la duda del posible entrenamiento de Sora con YouTube podría tener sentido. Podría tenerlo debido a que la compañía afirmó que era imposible entrenar a nuevos modelos sin utilizar materiales protegidos por derechos de autor.

Apúntate a nuestra newsletter y recibe en tu correo las últimas noticias sobre tecnología.

Mostrar comentarios

Códigos Descuento