in

Medios restringen el acceso al Wayback Machine ante preocupaciones por el uso de IA

Periodistas y archiveros advierten sobre el riesgo para la memoria pública mientras medios como New York Times y USA Today limitan el acceso al archivo por sospechas de scraping para IA

Medios restringen el acceso al Wayback Machine ante preocupaciones por el uso de IA

En los últimos meses ha emergido un conflicto entre preservación digital y protección de contenidos: varios grandes medios han empezado a impedir que el archivo histórico de la web acceda a sus páginas. El recurso en cuestión es el wayback machine, operado por el Internet Archive, y la decisión de bloquearlo responde, sobre todo, a la preocupación por el uso indebido de sus copias por parte de empresas que alimentan modelos de IA.

Esta tensión pone sobre la mesa cuestiones de acceso público, propiedad intelectual y la capacidad de la sociedad para reconstruir hechos pasados.

Informes de terceros señalan que alrededor de 23 organizaciones de noticias han adoptado medidas para impedir que el crawler del archivo capture sus páginas, según datos difundidos por Originality AI y reseñas en publicaciones como Wired y Nieman Lab. Entre los nombres señalados figuran medios de alto perfil que han usado a su vez el archivo para investigaciones propias, como apuntan ejemplos periodísticos donde se recurrió al Wayback Machine para verificar documentos o declaraciones.

La paradoja de que algunos periódicos usen el archivo para sus pesquisas pero lo bloqueen para el público ha alimentado el debate.

Motivos del bloqueo: la amenaza percibida por el entrenamiento de modelos

La explicación de fondo no es eludir muros de pago ni facilitar eludir restricciones de acceso, sino impedir que el acervo histórico sea aprovechado por terceros para el entrenamiento de modelos de lenguaje y búsqueda. Las editoriales argumentan que sus textos, alojados en el archivo, pueden ser recolectados por operadores de IA en violación de sus derechos de autor y con el riesgo de crear productos que compitan con su oferta informativa.

Voceros de algunos medios han señalado que esa reutilización masiva vulnera normativas y priva a los propietarios del control sobre cómo se emplea su contenido.

Perspectiva de archiveros y críticos

Desde la trinchera del Internet Archive se advierte que la pérdida de acceso al archivo público erosiona la posibilidad de verificar versiones previas de páginas y de recuperar información borrada o modificada. El director del proyecto ha reprochado que los mismos medios se benefician del archivo para documentar investigaciones, pero al mismo tiempo restringen su labor.

La discusión toca además conceptos técnicos como crawlers y prácticas de indexación masiva, y plantea si es posible reconciliar protección de contenido y función pública del archivo.

Impacto en la memoria pública y en la investigación

Si la tendencia a bloquear el acceso se extiende, investigadores, periodistas y ciudadanos perderían una herramienta clave para reconstruir la historia digital. El Wayback Machine sirve como un registro histórico que permite comprobar cómo evolucionaron declaraciones oficiales, reportajes o políticas editoriales. La limitación de ese registro complica auditorías, seguimiento de desinformación y transparencia gubernamental, y debilita la capacidad de la sociedad para exigir cuentas a instituciones y medios en el futuro.

Reacciones profesionales

Como respuesta a los cierres, más de cien periodistas suscribieron una petición que defiende el papel del archivo en la preservación del registro público. Además, plataformas sociales como Reddit han tomado medidas semejantes por temor a usos similares. La existencia de este movimiento evidencia una polarización entre quienes priorizan la protección comercial del contenido y quienes enfatizan el valor público de un registro verificable y accesible.

Posibles salidas y diálogo en curso

Actualmente hay un canal de comunicación abierto entre el Internet Archive y las organizaciones que han limitado el acceso, lo que sugiere que existen alternativas por negociar. Entre las vías sobre la mesa se encuentran acuerdos de licencia, exclusiones técnicas para impedir usos comerciales de terceras partes o la implementación de metadatos que señalen restricciones de uso a empresas de IA. Cualquier solución técnica deberá equilibrar la protección de la propiedad intelectual con la salvaguarda del patrimonio digital.

Qué está en juego

La disputa no es sólo técnica: afecta la transparencia democrática, la investigación periodística y el desarrollo responsable de tecnologías. Mantener un registro web accesible ayuda a documentar decisiones y a comprender cambios en la esfera pública; por otro lado, las empresas y medios reclaman herramientas para evitar que su trabajo sea explotado sin compensación. La búsqueda de un punto medio requerirá acuerdos claros sobre licencias, límites para el scraping y controles sobre el uso de corpora para el entrenamiento de modelos.

En definitiva, la discusión alrededor del Wayback Machine plantea preguntas complejas sobre quién controla la memoria digital y cómo se equilibra la innovación en IA con los derechos de creadores y la necesidad de un registro público verificable. El resultado de estas negociaciones determinará si la sociedad preserva una herramienta crucial para la rendición de cuentas o si ese archivo pierde alcance ante el avance de prácticas de recolección de datos en la sombra.

¿Qué piensas?

Escrito por Francesca Neri

Formación académica de excelencia en innovación y management, hoy analista de las tendencias que moldearán los próximos años. Predijo el ascenso de tecnologías cuando otros aún las ignoraban. El futuro no se adivina, se estudia.

Tomodachi Life: Living the Dream — guía y opinión para Nintendo Switch

Tomodachi Life: Living the Dream — guía y opinión para Nintendo Switch

Allbirds deja las zapatillas y apuesta por la infraestructura de IA como NewBird AI

Allbirds deja las zapatillas y apuesta por la infraestructura de IA como NewBird AI