Internet Archive: la biblioteca de Alejandría del siglo XXI

el mensual

  • Marzo 2016
  • Febrero 2016
  • Enero 2016

Internet Archive: la biblioteca de Alejandría del siglo XXI

Servidores de Internet Archive
Algunas de las unidades de petabox (petacajas) que almacenan la información del Internet Archive. (Jose Ángel González)

"Internet está en guerra". Mientras manosea una especie de masa de arcilla sintética pensada para ocupar las manos de las personas que, como él, viven en una eterna inquietud, una necesidad apremiante de cinética y movimiento, Brewster Kahle habla de hostilidades, quizá silenciosas y sin derramamiento de sangre, pero tan belicosas como cualquier combate: con objetivos, despliegue de tropas y víctimas. "Estamos en la III Guerra de Internet. Tras la de las redes y la del software, ahora peleamos por los contenidos y las ideas", dice con la mirada, de un acuoso azul anglosajón perdida en algún lugar del despacho. Está descalzo y somete al sillón a un balanceo persistente. "La pregunta es: ¿quién va a controlar las ideas?, ¿cómo se van a distribuir, con cuánta libertad, con cuánta privacidad, con cuánta independencia?".

Sobre la puerta de entrada a la oficina de Kahle hay dos símbolos: un reloj de esfera redonda y vieja pero de infalible tecnología mecánica y un cartel que dice ‘Bibliotecario’. Acaso ambos puedan entenderse como emblemas de las armas con las que este hombre está dispuesto a entrar en la contienda: historia –la forma corpórea del tiempo– y palabras –la materia prima de las ideas, por muy técnicas que sean–. "Los archivistas estamos armados. Podemos derrotar a cualquiera", afirma el peculiar empresario que se prepara para la contienda como cabecilla de un ejército letrista en el que las unidades de choque se miden en cantidad de información. La armada del bibliotecario pesa 10 petabytes. No hay en el mundo otro destacamento bélico tan numeroso.

Estamos en un edificio blanquísimo al que las seis columnas dóricas que flanquean la entrada conceden cierta aspiración neoclásica. Desde 1913 fue la sede en San Francisco (EE UU) de la Iglesia de la Ciencia Cristiana, una religión montada sobre la idea de que las enseñanzas de Jesús tienen valor de ley científica. Los feligreses del culto, que casi se ha desvanecido, eran buena gente y recomendaban máximas que parecen guiones de un programa de radio nocturno al que llaman almas solitarias: "Un corazón más suave, un carácter subyugado, una vida consagrada, restaurarían la acción correcta del mecanismo mental".

Equidistante del Golden Gate Park, donde los hippies preñaron al planeta con la simiente del amor en los años sesenta, y del Golden Gate Bridge, el lugar con más suicidios del mundo –uno cada dos semanas por término medio–, el edificio es desde 2009 la sede del Internet Archive (Archivo de Internet, IA), la casa donde el hombre con la masa de arcilla en la mano intenta convertir en arma estratégica un eslogan, que suena profundamente cristiano: "Acceso universal a todo el conocimiento". Jesucristo, profeta del amor, y Satán, ángel de la muerte, también subscribirían el enunciado.

La armada de 10 petabytes no es tangible en el interior del edificio, pero sabes que te rodea. Si llegas temprano, antes de que empiece el trajín de los 30 empleados –el IA tiene una plantilla de 120 más, repartida por otras subsedes–, puedes apreciar físicamente el zumbido ahogado que emerge de los racks de discos duros situados aquí y allá. Son de color negro mate y están poblados por LEDs azules que te hacen guiños infinitos. Las unidades –petabox, petacaja, las llaman– son mantenidas a una temperatura constante de 21 grados, la mejor para el hardware. Todo mimo es poco: los discos almacenan la memoria donde está todo Internet, desde la primera web hasta la última pendejada viral.

La nueva biblioteca de Alejandría

Conviene explicarlo de una vez. Grabar en vídeo de alta definición todos los minutos de vida de un ser humano desde el nacimiento hasta la muerte a los 100 años ocuparía solamente medio petabyte de espacio virtual. Los 10 petabytes de información que almacena el IA equivalen a 10 millones de gigabytes, más o menos lo mismo que 10.000 millones de libros –66 veces más que la Biblioteca del Congreso de los EE UU, la mayor del mundo (150 millones de ejemplares), 400 veces más que la Nacional de España (25 millones) y 11.000 veces más que la mítica de Alejandría, que albergaba 900.000 manuscritos–.

Nacido en 1960 en Scardale, un suburbio de gente acomodada situado al norte de la ciudad de Nueva York, Kahle ya había mostrado su vocación en el colegio: a los 12 años intentó diseñar un sistema para encriptar conversaciones telefónicas. Más tarde empezó a darle vueltas a montar una colección integral de artefactos culturales mientras destacaba como alumno aventajado en el Instituto Tecnológico de Massachusetts, donde se especializó en Inteligencia Artificial. "Era un idealista utópico y me preguntaba qué hacer con la tecnología que tuviese un alcance mundial. Se me planteaban dos alternativas. Una, ayudar a proteger la intimidad de la gente, pero no encontré manera de adaptar esa idea a las necesidades del hombre común e intuí que solo iba a servir para ayudar a militares, mafias y corporaciones a las que no me interesaba ayudar. La segunda era hacer una biblioteca de todo, la nueva biblioteca de Alejandría".

Con sus dos primeros proyectos tras la universidad, Kahle ganó tanto como para consolidar su sueño. En 1992 desarrolló el protocolo de búsqueda de texto Wide Area Information Servers (WAIS), que vendió a AOL tres años después por 11 millones de euros, y en 1996 montó el primer medidor de tráfico on line, Alexa Internet –bautizada con la biblioteca de Alejandría en mente–, que pasó a manos de Amazon en 1999 por 188 millones. "De pronto me vi con tal cantidad de dinero que no necesitaba más, me podía permitir casi cualquier cosa y, al mismo tiempo que ponía en marcha Alexa, empecé con el Internet Archive. La expansión de la World Wide Web fue fundamental porque me di cuenta de que sucedía algo nuevo en la historia de la humanidad: todo el mundo podía ser un editor o un coleccionista. Cuando me invitaron a visitar el supercomputador de Altavista [el primer buscador, lanzado en 1995] se reactivó mi idea de coleccionarlo todo. ¡Tenía el tamaño de apenas dos máquinas expendedoras de Coca Cola y almacenaba nada menos que 300 millones de páginas web, el tamaño que tenía Internet en aquel entonces! En ese momento pensé que mi sueño podía hacerse realidad".

Tenía el tamaño de dos máquinas de Coca Cola y almacenaba 300 millones de páginas web, el tamaño que tenía Internet entoncesLos números tienen hoy una dimensión monumental. Desde 1996, cuando el IA empezó a funcionar, la biblioteca de todo ha almacenado los siguientes fondos: 240.000 millones de páginas web –muchas de ellas cerradas por sus propietarios e inaccesibles desde un navegador–, 200.000 libros digitalizados, 900.000 ficheros de audio, 350.000 informativos de televisión, un número creciente de programas de software para viejos sistemas operativos, 3.200 películas y el catálogo completo de imágenes de la NASA. Todo el material se puede descargar sin pagar un céntimo desde la web del archivo o utilizando una aplicación peer-to-peer, BitTorrent. El site, con casi dos millones de visitantes por día, ocupa el número 250 con más tráfico global, y el bibliotecario Kahle figura junto al Dalai Lama en una lista de los "cincuenta visionarios que cambiarán el mundo".

El anhelo de este ejercicio saludable del síndrome de Diógenes virtual es evitar la "edad oscura digital" apuntada por algunos historiadores, convencidos de que se puede dar una situación futura en la que sea imposible leer documentos electrónicos que hayan sido conservados en formatos obsoletos y "sin esos artefactos culturales la civilización no tendría memoria ni forma alguna de aprender de sus triunfos y fracasos". Según Kahle y sus archivistas, que consideran importante todo byte porque la historia se escribe con frases cortas, la nueva biblioteca de Alejandría protege el derecho al conocimiento, nos permite ejercer el no menos importante derecho a los recuerdos en un tiempo de "severa amnesia" por la sobredimensión informativa, es un espejo de la evolución cambiante de Internet y resucita vínculos muertos, "las exasperantes webs con el mensaje: 404-página no encontrada".

En los límites de la legalidad

La herramienta del IA para rastrear la web y archivarla rinde homenaje al artilugio para viajar en el tiempo que aparecía en la serie de animación Mr. Peabody. Se llama Wayback Machine (que se podría traducir por Máquina de Regreso) y se dedica a escanear todo Internet y archivar cada página web pública que encuentre. Desde su puesta en funcionamiento en 1996 ha recorrido la totalidad de la Red una docena de veces, y almacena una media de dos terabytes de material cada mes. Los usuarios pueden buscar a través del servicio viejas versiones de páginas web o explorar cómo era Internet en sus balbuceos.

El asunto no es un mero pasatiempo revivalista. La continúa batida de búsqueda de contenidos alojados en Internet que ejerce el IA está en los límites de la legalidad y ha originado protestas de medios de comunicación –por ejemplo, el poderoso The New York Times, cuyos servicios de consulta de hemeroteca son de pago, ya ha amenazado a Kahle con una demanda– y de grupos políticos de presión, como las organizaciones de extrema derecha que acusaron en 2011 al fundador del archivo de alojar versiones antiguas pero de utilidad con fines perversos de webs extremistas islámicas que defienden la yihad contra EE UU. La Iglesia de la Cienciología logró en 2002 que fueran retiradas de la Wayback Machine las páginas críticas contra la secta.

"Este tipo de problemas es menor", se defiende Kahle. "Los desacuerdos muestran también qué desean las personas de las nuevas tecnologías y, en ese sentido, los fallos pueden ser tan interesantes como los éxitos. Personalmente no me interesa construir un imperio, sino algo que rinda provecho a los demás... Hay, por ejemplo, comunidades que se dedican a coleccionar grabaciones musicales. No lo hacen por dinero, sino por amor a la música y nosotros intentamos ayudarles... Es una forma de montar un sistema de bibliotecarios y archivistas interconectados, porque todos tenemos algo que puede ser de utilidad para los demás, una pericia, una obsesión... El Internet Archive es una organización no estática, no una gran empresa que implique la muerte de la imaginación".

Personalmente no me interesa construir un imperio, sino algo que rinda provecho a los demás¿De dónde sale el dinero para mantener en funcionamiento el IA? Además y primordialmente de la fortuna personal de Kahle, el archivo –que tiene la forma jurídica de entidad sin ánimo de lucro– se nutre de subvenciones de unas 250 entidades, entre ellas el Smithsonian Institute o la Biblioteca del Congreso, que sueltan dinero a cambio de servicios de catalogación y búsqueda. Colabora con muchas instituciones de diferentes lugares del mundo (entre ellas, la Biblioteca Nacional de España). En este momento escanean unos mil libros al día en 23 oficinas en seis países.

En un extremo del amplio espacio de trabajo –diáfano, con el suelo de madera y el artesonado original de la vieja iglesia– hay un rincón para descansar en un par de sofás y tomar un refrigerio. Las opciones combinan las obsesiones estadounidenses por las chucherías (Cheerios y cookies) y, quizá por arrepentimiento, la comida sana (copos de avena, plátanos, manzanas, barritas energéticas). Uno de los empleados, un tipo de treinta y tantos que en la calle pasaría por un liberal de vida más o menos disoluta, viene a tomar un té y una pieza de fruta. Aprovecha la deglución para tocar una tonadilla bluegrass en un ukelele que alguien ha dejado por allí. Otra de las trabajadoras llega con su perro, al que ata a la pata de la mesa. Un tercero está hiperconcentrado en la pantalla del Mac mientras escucha a muchos decibelios música trash.

No hay nada que se parezca al muy cercano Silicon Valley en el paisaje de la antigua iglesia, enclavada en el barrio de Inner Richmond de San Francisco («Un buen lugar para soñadores», según Kahle), a varias de cuyas manzanas de viviendas el IA regala una potente señal de Wi-Fi que provocó el rechinar de dientes de las operadoras telefónicas que se reparten el mercado –y cobran tarifas estrafalarias para tratarse de la capital tecnológica del mundo–. "Al final tuvieron que callarse. Es nuestra antena de Wi-Fi, tenemos el ancho de banda que queremos y damos acceso a quienes queremos. Es nuestro derecho".

Por una Red abierta

Refractario a las organizaciones verticales y de poder centralizado ("Las empresas de EE UU se han convertido en demasiado grandes y demasiado poderosas"), Kahle está convencido de que algo ha cambiado para mal en la forma en que funciona el 2.0. "Lo digital ha pasado de ser controlado localmente a ser controlado centralmente, de sin ánimo de lucro a con ánimo de lucro, de diverso a homogéneo, de regido por la ley a regido por los contratos...". ¿Hay espacio para el optimismo? "Depende del día en que me preguntes. Si me levanto de un lado de la cama pienso que esto es un desastre y estamos perdiendo cada batalla... Otros días me levanto y me parece que hay gente haciendo cosas creativas, peculiares e interesantes. Quizá las corporaciones sigan mandando, pero están pasando cosas que invitan a cierto optimismo: Firefox está construyendo un teléfono, Ubuntu también... Hay un ambiente más abierto. Tenemos que esperar. No sé qué pasará, pero sé que hay gente trabajando en buenas ideas en la esfera de lo abierto. Todavía no hemos perdido".

La gran tragedia reciente para Kahle fue el suicidio por ahorcamiento, en enero de 2013, de su amigo y colaborador Aaron Swartz, de 26 años, uno de los más brillantes programadores informáticos de su generación –a los 14 años inventó el formato de sindicación RSS, herramienta hoy universal para la difusión de información actualizada, y en 1998 cofundó el agregador reddit–. Hostigado por la Justicia por bajar millones de documentos académicos sujetos a copy-right, la Fiscalía pedía para el hacker bueno hasta 30 años de cárcel. "Aaron Schwartz vivió una vida de código abierto. Flotó, ayudó y se movió. No era un hombre de empresa, no era institucional e inspiró a mucha gente. Era un ángel y fue aplastado por instituciones que no aceptaban las nuevas ideas, entre ellas el Gobierno de EE UU".

¿Puede establecer algún paralelismo entre las muerte de Swartz y la de otra gran figura de la informática, Steve Jobs? "Conocía al segundo bastante mejor que al primero", dice Kahle muy serio y antes de un largo silencio durante el que deja de balancear el sillón-mecedora y amasar la arcilla antiestrés. "Nunca se me había ocurrido compararlos... La esencia del trabajo de Steve Jobs estaba en el diseño, en desarrollar objetos hermosos. No me parece que la metodología de Apple haya contribuido demasiado a la inteligencia colectiva. Han ofrecido un gran diseño, hermosura, belleza, pero en términos de influencia no se puede decir mucho... ¿Diferencias entre estos dos hombres? Steve Jobs creció en la era de las compañías y Aaron Schwartz creció en la era de Internet".

Adalid de la información abierta y sin filtros restrictivos –fue uno de los líderes de las protestas contra la SOPA, la ley contra la piratería que restringe el derecho a la libre información– y bailando siempre mil danzas –la última, montar un banco según el modelo de una cooperativa en un barrio deprimido de Nueva Jersey–, los amigos de Kahle dicen que no es capaz de mantener las ideas en el plano inmaterial y, por muy complejas o inverosímiles que parezcan, necesita aplicarlas, verlas en acción y evangelizar sobre sus ventajas. Durante esta entrevista confesó que sigue muy de cerca lo que sucede en España ("Espero que algo nuevo surja de la situación difícil y el desempleo de tanta gente joven, porque el sistema que les ofrecemos no funciona nada bien"). Cuando se le menciona la propuesta de que se admita el voto electrónico directo para cada medida legislativa se le enciende la mirada: "¡Me encanta! Es una idea poderosa y estoy seguro de que sería fructífera. Demuestra que replantear las estructuras políticas es posible".

En el piso de arriba de la antigua iglesia han dejado tal cual el gran salón donde los fieles se reunían. En las bancadas están alineadas 400 figuras de terracota que representan con un fiel realismo a todas las personas que han trabajado durante más de tres años como archivistas o programadores en el Internet Archive. Son el ejército de bibliotecarios que ha cimentado la biblioteca de todo, un símbolo de las personas detrás de los bytes. La pregunta es inevitable: ¿ha valido la pena el esfuerzo para compilar todo lo que conforma ese sótano de subculturas y fotos de gatos que es Internet? "Nosotros somos así. La World Wide Web es un registro fantástico y un buen reflejo de la gente: el idiota, el raro, el banal... Pero no te engañes, no todos somos Homer Simpson, no todos estamos esperando por el nuevo baile de Lady Gaga".

Internet Archive en cifras

  • 10 petabytes. Cantidad de información almacenada en el Internet Archive. Un petabyte equivale a un millón de gigabytes o a 10 bytes elevados a la 15ª potencia.
  • 10.000 millones de libros impresos -400 veces más que los almacenados en la Biblioteca Nacional de España- serían necesarios para contener la misma información.
  • 240.000 millones de páginas web. La Wayback Machine (Máquina de Regreso) del Internet Archive ha rastreado y guardado todas las webs de Internet.
  • 900.000 archivos de audio. El IA también digitaliza, y ofrece gratis, música, informativos de televisión, películas y libros electrónicos.
Síguenos en Facebook para estar informado de la última hora:
Publicada en la dirección url http://www.20minutos.es/noticia/1927160/0/internet-archive/historia/red/ accede a la noticia online capturando este código en tu móvil Código QR

Cerrar

Mostrar gráfica

¿Cómo leer la gráfica?

  • Hay tres variables que se distinguen por colores: ECO de 20minutos.es, en rojo; ECO en redes sociales, en verde, y ECO total (una combinación de los dos anteriores), en azul. El usuario puede activar o desactivar cada una de ellas en cualquier momento con los botones que aparecen justo debajo de la representación gráfica.
  • Al pasar el ratón por cada punto de la gráfica aparecerá el valor (en porcentaje) de cada una de las variables que estén activadas en una fecha y una hora concretas.
  • Zoom: Al seleccionar una zona de la gráfica cualquiera, esta se ampliará. Automáticamente aparecerá un botón a la derecha con las letras reset zoom. Pinchando ahí, la gráfica volverá a su posición inicial.

Más información

Hemos bloqueado los comentarios de este contenido. Sólo se mostrarán los mensajes moderados hasta ahora, pero no se podrán redactar nuevos comentarios.

Consulta los casos en los que 20minutos.es restringirá la posibilidad de dejar comentarios