ChatGPT roza el aprobado para ejercer como médico: y ahora, ¿qué?

La IA de ChatGPT ha demostrado en su fase de pruebas su gran utilidad para llevar a cabo tareas que antes nos llevaba más tiempo. — La IA de ChatGPT.

No será porque no estábamos avisados. Y no se trata solo del millón de películas que hemos visto sobre ello, sino porque la Inteligencia Artificial (IA) lleva tiempo con nosotros. Una enorme cantidad del software que utilizamos está propulsado por sistemas de IA: solo por citar algunos casos, cuando miramos un mapa en Google, hacemos una búsqueda en internet, compramos en Amazon, vemos una serie en Netflix, publicamos en Twitter, Facebook o Instagram, pagamos con tarjeta, utilizamos un antivirus o usamos cualquier tipo de cosa llamada “smart”, al otro lado hay IA. Sin que nos hayamos dado cuenta, ha ido entrando en nuestras vidas hasta formar parte de ellas.

Y no digamos en los campos profesionales: desde la ciencia a la economía o la ingeniería, los sistemas de IA son omnipresentes, y hoy ya el mundo no avanzaría sin ellos. Pero sí es cierto que algo nuevo está ocurriendo. El radioastrónomo Danny Price, de la Universidad Curtin de Australia, uno de los muchos científicos que utilizan estos sistemas como herramienta de trabajo, escribía hace poco que estamos viviendo una "explosión cámbrica" de la IA, en analogía con la rápida expansión de formas de vida que pobló el planeta hace 540 millones de años.

Y siguiendo con la comparación, si hay un trilobites de esta reedición digital de la explosión cámbrica, como ejemplo más representativo y popular, es sin duda el modelo grande de lenguaje ChatGPT. Este sistema creado por Open AI (léase Elon Musk), puesto a disposición del público en su web dedicada en noviembre pasado y antecesor de un nuevo sistema integrado ahora en el buscador Bing de Microsoft, se ha convertido en toda una estrella mediática. No hay semana en que no sea protagonista de alguna noticia, casi siempre por motivos chuscos: sus instrucciones para fabricar un cóctel Molotov o una bomba nuclear, los “Heil Hitler” y sus, en fin, desvaríos de amor y muerte.

Microsoft limita el uso de ChatGPT en Bing a 5 mensajes por conversación y 50 conversaciones al día

Pero más allá de todo este jijijí-jajajá, resulta que ahora hemos descubierto que un sistema de IA puede hacer un trabajo escolar o universitario tan bien como o mejor que una persona. Y hay mucho más: ya sabíamos que ChatGPT había aprobado exámenes de derecho o de máster en administración de empresas. La última hazaña es que se ha quedado al borde de sacarse el título de médico en EE UU.

Aprobar sin copiar

Esta es la historia. Investigadores de una startup californiana llamada AnsibleHealth sentaron a ChatGPT, es un decir, y le pusieron el United States Medical Licensing Examination (USMLE), digamos el examen MIR de EEUU. Los investigadores seleccionaron las preguntas con cuidado, comprobando que las respuestas no estaban disponibles en Google. Es decir, querían asegurarse de que este ciberalumno no estuviese simplemente pescando de internet las respuestas ya existentes a las preguntas que recibía, sino que debía responderlas solo basándose en su entrenamiento previo, sin recibir formación específica en medicina. En otras palabras: no valía copiar.

El resultado fue que, en las tres partes de las que consta el examen, ChatGPT puntuó entre un 52,4 y un 75%. Dado que el aprobado está en torno al 60% en el global, puede decirse que aprobó, o casi. Es más, en un 89% de las respuestas produjo lo que los investigadores definen como perspectivas significativas, respuestas que pueden considerarse nuevas, no obvias y clínicamente válidas.

O sea, que ChatGPT ya puede ejercer como médico. O, al menos, podría, si se dieran licencias a máquinas.

Los investigadores han publicado un estudio con sus resultados en la revista PLOS Digital Health. Y sus conclusiones se quedan en lo estrictamente neutro e inmediato, como es obligado en todo estudio científico: “Los modelos grandes de lenguaje tienen el potencial de ayudar en la formación médica, y posiblemente en la toma de decisiones clínicas”.

Pero en un comentario editorial publicado junto con el estudio, que para eso están los comentarios editoriales, varios expertos de instituciones como el MIT, Harvard o Mount Sinai advierten: “El hecho de que ChatGPT apruebe el USMLE pone el foco en los defectos de la formación médica”. Los autores dan por supuesto que la formación en medicina requiere memorización pura y dura, pero añaden: “Cada vez somos más conscientes de que la capacidad de regurgitar modelos mecanísticos de salud y enfermedad, como a menudo ocurre durante las rondas, puede ser menos importante en esta era de la información rápidamente accesible al alcance de los dedos”.

ChatGPT no es HAL 9000

Hay algo que no debemos olvidar, y es que ChatGPT no piensa. No como lo que nosotros entendemos por pensar. Por muy "listo" que pueda parecer, no es HAL 9000. La Inteligencia Artificial General, como los científicos llaman a eso que tanto nos ha mostrado el cine, un ser pensante y sintiente en una máquina, es algo que aún no existe. ChatGPT es un chatbot, una máquina de conversación. Está entrenado con millones y millones de textos, y está especializado en dialogar y responder, utilizando los datos que tiene a su disposición y buscando la manera más probable de enlazarlos para que tengan sentido. En realidad, se parece más al autocompletar del móvil que a HAL 9000.

Según los autores del editorial, “exámenes como el USMLE fracasan al intentar evaluar de forma completa las habilidades requeridas para la práctica médica moderna”, porque se basan en esa memorización pura y dura de mecanismos. Un amigo farmacéutico suele decir que Medicina, tal y como está generalmente concebida, es una carrera de letras: acto, delito, pena; síntomas, diagnóstico, tratamiento. “Es hora de repensar cómo entrenamos y evaluamos a nuestros estudiantes”, concluyen los autores.

Es hora de repensar cómo entrenamos y evaluamos a nuestros estudiantes

Y si esto puede decirse de algo tan especializado y exigente como la formación médica, qué no podrá decirse de la educación escolar general, en la cual muchos profesores ya están calificando, sin saberlo, trabajos redactados por ChatGPT.

Los más viejos del lugar recordarán aquel concurso presentado por el gran, gran Constantino Romero, en el que se planteaba a los concursantes una pregunta de este jaez (parodiando un poco, pero no mucho): el día 4 de Junius del año 62, Séneca compró un cucurucho de morros de ocelote en un puesto callejero de Roma. El dueño de dicho puesto era un veterano de guerra de la conquista de Gran Bretaña que había combatido a las órdenes de un centurión cuya hermana menor vivía en Creta. ¿Cómo se llamaba la hija del peluquero de la hermana del centurión? Detrás de los concursantes había una librería compuesta por unos doscientos mil volúmenes, de los cuales tenían que llegar a entresacar la respuesta, avanzando paso a paso, dato a dato.

Hoy este concurso sería implanteable: internet mediante, cualquiera que hasta ahora creyera que Séneca era una marca de papel higiénico podría llegar a la respuesta en unos minutos. Gracias a internet, podemos hacer lo mismo que ChatGPT: responder a cualquier cosa, sin pensar ni saber absolutamente nada. Entonces, el problema no es ChatGPT. Es la forma de enseñar y examinar, que no ha variado mucho en siglos. Y que ya no sirve. Hay que inventar otra cosa.