Los misterios detrás del superordenador de Microsoft que ha impulsado el lenguaje GPT de OpenAI

El nuevo superordenador de Azure está pensado para entrenar a ChatGPT.
El nuevo superordenador de Azure está pensado para entrenar a ChatGPT.
Microsoft
El nuevo superordenador de Azure está pensado para entrenar a ChatGPT.

Microsoft ha desarrollado un superordenador para entrenar al modelo de lenguaje de gran tamaño ChatGPT que implementó en la última actualización de su buscador. Para el proyecto, la empresa ha invertido varios cientos de millones de dólares y llevan desde 2019 trabajando en él, cuando comenzaron a colaborar con OpenAI.

El objetivo con la creación de la computadora era desde un principio acelerar el avance de la inteligencia artificial. La infraestructura en la nube que la división Azure de la marca utilizaba hasta ahora contaba con decenas de miles de unidades gráficas de Nvidia A100 conectadas entre sí, formando "una red de alto rendimiento y baja latencia". Estas estaban comunicadas mediante la arquitectura InfiniBand de Nvidia y estaban enfocadas para la optimización de IA.

Según Nighi Chappell, jefe de producto de Microsoft para Azure High, "esta escala es mayor de la que han probado incluso los proveedores de GPU y equipos de red". Él reconoce que estaban en "territorio desconocido" al explorar las capacidades de su superordenador: "Nadie sabía con seguridad si el hardware podía llevarse tan lejos sin romperse".

La computadora ha recibido el nombre de VM ND H100 v5 y admite tamaños de entre ocho y miles de GPU. De momento, está disponible en una versión preliminar, aunque Microsoft pretende convertirlo "en una oferta estándar de Azure" para que cualquiera pueda "desbloquear el potencial de la IA a escala en la nube".

¿Cómo consiguieron la supercomputadora para IA?

Chappell explica que el equipo tuvo que dividir la carga de trabajo de computación en miles de GPU alojadas en un clúser. La idea no era solo conectar una gran cantidad de GPU y ponerlas a trabajar en conjunto, sino que había que optimizar el sistema para "obtener el mayor rendimiento".

El resultado obtenido fue posible por la integración de tecnología como las últimas GPU Nvidia H100 Tensor Core y la red Quantum-2 InfiniBand.

Apúntate a nuestra newsletter y recibe en tu correo las últimas noticias sobre tecnología.

Mostrar comentarios

Códigos Descuento