A pesar de que Google presentase su inteligencia artificial (IA) multimodal Gemini como la más capaz jamás creada, OpenAI sigue liderando el sector con ChatGPT-4. No obstante, la compañía de Sam Altman es consciente de que la calidad de las respuestas de su chatbot es menor y que, en vez de mejorar, la IA se está volviendo cada vez más vaga y, para mantener su posición en la cúspide, están buscando una solución.

En España, ChatGPT ya cuenta con más de cuatro millones de usuarios activos mensuales después de un año de su lanzamiento. No obstante, los resultados que obtienen, a veces, no son los indicados. Las alucinaciones, que son datos incorrectos que los da como verdaderos, o los códigos defectuosos, están a la orden del día, y el problema no es que demos malos avisos, sino que el modelo está volviéndose cada vez más perezoso.

OpenAI ha reconocido que tienen ese inconveniente, por lo que no es una suposición, sino una realidad. Hay un estudio que ha descubierto que la IA es más rápida y efectiva si trabaja bajo presión. Sin embargo, los investigadores de la empresa se han puesto 'manos a la obra' para resolver la situación de raíz.

¿Por qué ChatGPT se ha vuelto más vago?

La firma estadounidense ha aclarado que se trata de un comportamiento impredecible que no han visto venir y que está yendo a peor con la última actualización: ChatGPT-4 Turbo. OpenAI explica que no es que el modelo haya cambiado, pero sí hay una serie de diferencias en el comportamiento que da lugar a que las respuestas no sean tan buenas como en versiones anteriores cuando debería ser al revés.

Según detallan en una publicación de X (antes conocida como Twitter), la razón de este fallo podría deberse a que "se haya degradado solo un subconjunto de prompts y se puede necesitar mucho tiempo para que los socios y el personal se den cuenta y corrijan estos patrones".

El entrenamiento de la IA

La compañía ha señalado que el entrenamiento consiste también en trabajar en distintos aspectos, desde la personalidad o de escritura, hasta la evaluación de rendimiento y los sesgos políticos. El proceso de aprendizaje de la IA lo comparan con "un esfuerzo artesanal de varias personas" y no tanto con algo mecanizado.

Para dar con ChatGPT-4 y desarrollar actualizaciones, hay una gran cantidad de trabajadores que se encargan de la planificación, la construcción y la evaluación de los modelos de chats. Antes de lanzar algo nuevo, se realizan pruebas internas exhaustivas con métricas de evaluación offline y online.

Cuando la versión número cuatro salió en marzo, todo parecía ir correctamente. Las quejas de un bajón del rendimiento comenzaron a llegar en verano, con la primera actualización, y OpenAI ahora ha confirmado que es un problema de su chatbot y no de los usuarios. ¿Qué harán para que su modelo de lenguaje grande (LLM) no sea tan vago?

Apúntate a nuestra newsletter y recibe en tu correo las últimas noticias sobre tecnología.