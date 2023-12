Google es una de las empresas tecnológicas que más promete con su desarrollo en Inteligencia Artificial (IA). La semana pasada, anunció el lanzamiento de Gemini, su último gran modelo de IA que quiere competir contra la versión 4 de ChatGPT. Según sus creadores, es el más capaz que existe hasta la fecha, pero los expertos aseguran que han mentido con sus 'halagos'.

El modelo estará habilitado en varias herramientas de Google que podemos utilizar en España, como su chatbot Bard, en apps del teléfono Pixel 8 Pro, en servicios como Search, Ads, Chrome y Duet AI, etc. Por ese motivo, su presentación generó una gran expectación entre los españoles que querían probar esta novedad que parecía que podía desbancar a la IA de OpenAI.

La compañía recalcó que Gemini reconoce vídeo, imágenes, voz y texto, pero solo es capaz de devolver resultados en texto o código de momento. Asimismo, está habilitado en Bard, pero llegará a otras herramientas de su ecosistema en los próximos meses y cuenta con tres versiones (algunas más potentes que otras).

Aunque Google ya haya mostrado un vídeo de varias funciones de una de las versiones (la Pro), hay quien se ha quejado de que la demostración es una 'patraña' y que queda mucho por mejorar. Es decir, los expertos que ya han probado la IA desde Bard creen que las promesas que la multinacional presentó la semana pasada tardarán en llegar de verdad.

Los problemas de la nueva IA de Google: Gemini

En el vídeo en el que Google enseñaba las funciones de Gemini que lo convertían en el modelo de IA más capaz jamás creado, parecía que, efectivamente, esta novedad podía desbancar a ChatGPT-4.

Google promete en su anuncio que Gemini elimina el tiempo que el modelo está "pensando", por lo tanto, tendría que dar respuestas inmediatas. Sin embargo, los que ya han podido probarlo desde el chatbot de la empresa aseguran que tarda bastante más en dar resultados.

Por otro lado, la firma da a entender que se han omitido pasos intermedios para que el modelo llegue a las conclusiones correctas. Pero, a la hora de la verdad, parece que el vídeo fue falsificado. Según el medio de comunicación Tech Crunch, "se trataba de una serie de indicaciones de texto cuidadosamente ajustadas con imágenes fijas, claramente seleccionadas y acotadas para tergiversar cómo es en realidad la interacción".

Los usuarios no han tardado en quejarse en redes sociales de Gemini, ya que no ha cumplido con las expectativas generadas tras el anuncio de Google. "Estoy extremadamente decepcionado con Gemini Pro en Bard –afirma Vitor de Lucca, uno de los internautas que ha hablado del tema por X (antes Twitter-. Todavía da muy, muy malos resultados a preguntas que ya no deberían ser difíciles con RAG. Una pregunta simple como esta [refiriéndose a las imágenes compartidas] con una respuesta simple como esta, y aún así fue MAL". Como ejemplo, de Luca señalaba los errores que el modelo tenía al responder sobre los ganadores del Oscar de este año.

¿Cómo se creó el vídeo falso de Gemini?

Google admitió que el vídeo de demostración del funcionamiento de su nuevo modelo de IA estaba trucado. Según la descripción de la publicación subida a YouTube, habían reducido la latencia y las salidas de Gemini se habían acortado para reducir la duración del vídeo. Esto se traduce en que el tiempo de respuesta es más lento del que se sugiere en la demostración.

Además, un informe de Bloomberg aclara que "no se llevó a cabo en tiempo real ni en voz alta" y que se construyó a partir de "fotogramas de imágenes fijas del metraje y mensajes de texto". Por lo tanto, la IA no puede tener una conversación tan fluida como lo que se aparenta en el anuncio.

Según una publicación en X de Oriol Vinyals, de Google DeepMind, "todas las indicaciones y resultados del usuario en el vídeo" eran "reales", pero "abreviados" para reducir la duración de la demostración. Sin embargo, la filtración de Bloomberg, que asegura que se hizo con fotogramas de imágenes fijas, negaría que sean resultados verdaderos.

Las distintas versiones de Gemini

La herramienta Gemini de Google estará disponible en tres diferentes tamaños:

Gemini Ultra: nuestro modelo más potente y de mayor tamaño, para tareas de gran complejidad.

nuestro modelo más potente y de mayor tamaño, para tareas de gran complejidad. Gemini Pro: nuestro mejor modelo para escalar en una amplia gama de tareas.

nuestro mejor modelo para escalar en una amplia gama de tareas. Gemini Nano: nuestro modelo más eficiente para ejecutar tareas directamente en un dispositivo, disponible para móviles.

Las diferentes versiones de Gemini. Google

