La gigantesca biblioteca digital Internet Archive sufre una caída mundial porque usaban sus datos para entrenar una IA

Algunas de las unidades de petabox (petacajas) que almacenan la información del Internet Archive.
Algunas de las unidades de petabox (petacajas) que almacenan la información del Internet Archive.
Jose Ángel González
Algunas de las unidades de petabox (petacajas) que almacenan la información del Internet Archive.

El pasado domingo 28 de mayo, Internet Archive sufrió una caída por una sobrecarga de sus servidores debido a que una empresa estaba entrenando a su modelo de inteligencia artificial (IA) con los datos y los archivos de la hemeroteca.

Desde el pasado fin de semana, los usuarios aseguraron que tenían problemas a la hora de acceder al servicio cuando se encontraron con el mensaje 'Server Error 502', teniendo en cuenta que el aviso hace referencia a que el sistema está fuera de servicio o caído por una sobrecarga. Además, al día siguiente, la compañía afirmó a través de Twitter que archive.org estaba temporalmente inactivo y que estaban trabajando para resolver el problema.

Brewster Kahle (ingeniero y fundador de Internet Archive) señaló en el blog oficial de Internet Archive que un conjunto de 64 máquinas virtuales hospedadas en la plataforma AWS de Amazon estaban lanzando "decenas de miles de solicitudes por segundo" para recolectar sus archivos OCR de dominio público.

Los ingenieros bloquearon el acceso a las IPS de las que procedían las peticiones para remediar el problema, pero desafortunadamente, volvió a aparecer una segunda ronda de 64 direcciones IP para interrumpir el servicio. De nuevo, Internet Archive se quedó inaccesible y otra vez tuvieron que bloquear las IPs.

Ante ambas caídas, la compañía recomienda utilizar sus materiales "a granel", es decir, comenzando con una cantidad asumible e ir aumentando según las necesidades de los usuarios. Aunque en el caso de precisar de un gran volumen de archivos de libre disposición, Internet Archive aconseja que se contacte con ellos para hacerlo de forma segura y controlada para evitar los posibles colapsos.

Apúntate a nuestra newsletter y recibe en tu correo las últimas noticias sobre tecnología.

Mostrar comentarios

Códigos Descuento