Google lanza Lumiere, una IA para generar vídeos capaz incluso de dar vida a los cuadros de Van Gogh

Los resultados de Lumiere son mejores que los de otros generadores de vídeo, según los voluntarios a los que los investigadores han preguntado.

España ocupa el puesto 14 en el ránking de los 20 países que más utilizan herramientas de inteligencia artificial, según un estudio de Writerbuddy. En 2023, los españoles han realizado más de 377 millones de visitas a sitios de IA. El uso cada vez más extendido de este tipo de tecnología anima a los gigantes tecnológicos como Meta o Alphabet a investigar al respecto.

Este fin de semana, tanto la empresa matriz de Facebook como la de Google han presentado nuevas herramientas de IA. La primera ha sacado Code LLaMA, especializada en código; la segunda, ha hablado de Lumiere, capaz de crear vídeos e imágenes a partir de texto y con funciones de edición.

Carina IA, otro de los asistentes virtuales con IA de WhatsApp creados en España, ha superado los 350.000 usuarios registrados.

Carina IA: así es el chatbot español que está triunfando en WhatsApp

Lumiere, la nueva IA de Google

La empresa estadounidense define Lumiere como "un modelo de difusión espacio-temporal" enfocado en "la generación de vídeo realista". Sus desarrolladores han explicado que su herramienta es capaz de crear un vídeo de una sola vez, lo que proporciona que el resultado tenga "una coherencia temporal global", que lo diferencia de otros modelos de vídeo ya existentes.

Los investigadores de Google afirman que Lumiere es capaz de generar vídeos de 1024x1024 píxeles de hasta cinco segundos de duración. En el estudio, aclaran que los resultados son de "baja resolución", pero aseguran que una prueba con voluntarios demostró que su herramienta era la favorita si se comparaba con otros modelos de síntesis de vídeo de IA existentes.

Con Lumiere, los usuarios obtienen vídeos que tienen en cuenta factores como el espacio, es decir, dónde están las cosas, y el tiempo, que gestiona los movimientos de las cosas conforme transcurre el vídeo.

Entre los ejemplos que Google ha compartido a través de su canal de YouTube, se aprecian distintas funciones de Lumiere. Por ejemplo, se puede crear un vídeo a partir de texto, convertir imágenes fijas en un vídeo, generar vídeos en estilos específicos basándose en una imagen de referencia, editar un vídeo con prompts (peticiones escritas).

Una de las pruebas que la marca ha compartido es el famoso cuadro de 'La noche estrellada', de Vicent Van Gogh, con sus características nubes del cielo moviéndose.

Lumiere será capaz de dar vida a imágenes fijas, como 'La noche estrellada', de Van Gogh.

Los resultados de Lumiere son el principio del camino

Google no da detalles sobre el origen de los vídeos utilizados para desarrollar Lumiere. Únicamente, explican que han entrenado al modelo con "un conjunto de datos que contiene 30 millones de vídeos junto con sus subtítulos de texto". Eso sí, comentan que los vídeos son de 80 cuadros de largo a 16 fps y que el modelo base está entrenado a 128x128.

La propuesta de Google todavía está dando sus primeros pasos después de dos años de investigación de IA centrada en la generación de vídeos. Sin embargo, los últimos resultados prometen si tenemos en cuenta el primer modelo de síntesis de imágenes Imagen Video, que la firma tech presentó en octubre de 2022.

Imagen Video podía generar vídeos cortos de 1280x768 píxeles a partir de textos a 24 cuadros por segundo. En comparación, Lumiere resulta muy prometedor y es comparable a Make-A-Video, de Meta; Gen2, de Runway, que puede crear vídeos de dos segundos; y Stable Video Diffusion, capaz de crear clips cortos a partir de imágenes fijas.

Amazon lanzará un plan de pago de Alexa para los que quieran usar su versión impulsada por inteligencia artificial.

Amazon trabaja en Alexa Plus, una versión de pago que llevaría lo último en inteligencia artificial generativa

Cabe señalar que, de momento, solo conocemos la versión de los investigadores de Alphabet y que la herramienta no se ha lanzado públicamente. Por lo tanto, tenemos que fiarnos de lo que dicen en su estudio sin poder comprobar que los resultados son tan buenos como lo presentan. No obstante, de ser así, sería el modelo de generación de vídeos con IA más capaz hasta la fecha.

"Nuestro objetivo principal en este trabajo es permitir a los usuarios novatos generar contenido visual de una manera creativa y flexible –concluyen en la investigación-. Sin embargo, existe un riesgo de uso indebido para crear contenido falso o dañino con nuestra tecnología. Creemos que es crucial desarrollar y aplicar herramientas para detectar sesgos y casos de uso maliciosos con el fin de garantizar un uso seguro y justo".

FUENTES: el estudio de Google y el de Writebuddy

Apúntate a nuestra newsletter y recibe en tu correo las últimas noticias sobre tecnología.