La gigantesca biblioteca digital Internet Archive sufre una caída mundial porque usaban sus datos para entrenar una IA
- Internet Archive sufrió dos caídas mundiales porque se estaban lanzando decenas de miles de solicitudes por segundo.
- Google empieza a mostrar resultados al estilo de ChatGPT a la derecha del buscador.
- Evita las llamadas spam a partir del 30 de junio: cambia la Ley de Telecomunicaciones.
El pasado domingo 28 de mayo, Internet Archive sufrió una caída por una sobrecarga de sus servidores debido a que una empresa estaba entrenando a su modelo de inteligencia artificial (IA) con los datos y los archivos de la hemeroteca.
Desde el pasado fin de semana, los usuarios aseguraron que tenían problemas a la hora de acceder al servicio cuando se encontraron con el mensaje 'Server Error 502', teniendo en cuenta que el aviso hace referencia a que el sistema está fuera de servicio o caído por una sobrecarga. Además, al día siguiente, la compañía afirmó a través de Twitter que archive.org estaba temporalmente inactivo y que estaban trabajando para resolver el problema.
Brewster Kahle (ingeniero y fundador de Internet Archive) señaló en el blog oficial de Internet Archive que un conjunto de 64 máquinas virtuales hospedadas en la plataforma AWS de Amazon estaban lanzando "decenas de miles de solicitudes por segundo" para recolectar sus archivos OCR de dominio público.
Los ingenieros bloquearon el acceso a las IPS de las que procedían las peticiones para remediar el problema, pero desafortunadamente, volvió a aparecer una segunda ronda de 64 direcciones IP para interrumpir el servicio. De nuevo, Internet Archive se quedó inaccesible y otra vez tuvieron que bloquear las IPs.
Ante ambas caídas, la compañía recomienda utilizar sus materiales "a granel", es decir, comenzando con una cantidad asumible e ir aumentando según las necesidades de los usuarios. Aunque en el caso de precisar de un gran volumen de archivos de libre disposición, Internet Archive aconseja que se contacte con ellos para hacerlo de forma segura y controlada para evitar los posibles colapsos.
Apúntate a nuestra newsletter y recibe en tu correo las últimas noticias sobre tecnología.