¿Alguna vez ha hecho clic en un enlace solo para aterrizar en una página web vacía con el mensaje “Error 404” o “404 no encontrado?” Si es así, no estás solo. Hay varias razones por las que esto puede suceder: la más simple es una URL mal escrita. Pero cada vez más, la causa es que la página ha sido eliminada o movida, a veces intencionalmente.
Es por eso DW Fact Check ha reunido una guía para ayudarlo a encontrar contenido eliminado o alterado. También exploramos las herramientas más populares para el archivo digital, que son útiles no solo para recuperar contenido perdido, sino también para preservar cualquier cosa que encuentre en línea que pueda ser importante más adelante.
Como Las prácticas de verificación de hechos en línea han crecido en importancia, las herramientas para archivar el contenido digital se han convertido básico. Permiten a los usuarios tomar ‘instantáneas’ de sitios web o publicaciones de redes sociales, capturar cómo consideraron un momento específico en el tiempo y asegurando que sigan siendo accesibles, incluso si el contenido original desaparece.
El contenido de Internet cambia constantemente – Las páginas desaparecen, los enlaces se rompen y la información se edita o elimina. Según un estudio de la Centro de investigación de Pew El 38% de las páginas web de 2013 ya no están disponibles.
Archivar es más que una solución técnica: es una herramienta para la responsabilidad, la transparencia y la preservación del historial. Los casos del mundo real ilustran por qué el archivo es tan crucial.
En Enero de 2025La Casa Blanca cerró su página en español. La biblioteca del Congreso de los Estados Unidos eliminó ciertas partes de la constitución de los Estados Unidosde su archivo en línea.
En septiembre de 2022, Irán restringió el acceso a Internet en partes de Teherán y Kurdistán, bloqueando a Instagram y WhatsApp durante las protestas después de la muerte de una mujer kurda bajo custodia policial.
Y en China, un archivo de Internet una vez extensivo administrado por la Universidad de Pekín, que permitió búsquedas de más de 2.500 millones de páginas web históricas chinas, es ya no es accesible.
WLos archivos de EB han sido importantes en proporcionar evidencia en casos judiciales y discusiones públicas. Imágenes como capturas de pantalla se pueden manipular fácilmente. “Los archivos web, por otro lado, registran todo el contenido de una página web, incluida su fuente HTML e imágenes integradas, hojas de estilo o fuente de JavaScript”, escribió Michele Weigle, profesora de ciencias de la computación en Old Dominion University en su artículo Sobre la importancia del archivo web.
DW Fact Check ha reunido una lista de cuatro herramientas de referencia para el archivo web.
La máquina Wayback
Uno de los el más utilizado Herramientas de archivo gratuitas es la Wayback Machine lanzado en 2001 por la organización sin fines de lucro Archivo de internet. Su misión es “preservar esos artefactos (digitales) y crear una biblioteca de Internet para investigadores, historiadores y académicos”.
Sus primeros rastreos en Internet comenzaron en 1996,Para abordar los enlaces rotos (404 errores). Un rastreo es un proceso automatizado de recopilación y copia de páginas web, creando ‘instantáneas’ de ellas. Los usuarios pueden buscar por URL o palabras clave para ver cómo se veía un sitio en fechas específicas.
Pros: Completo, gratuito y ampliamente utilizado.
Contras: Ocasionalmente inaccesible debido a la piratería, las búsquedas de palabras clave pueden ser complicadas.
La máquina Wayback de Internet Archive es el archivo web público más antiguo y más grande, pero No es el único. Muchos países y bibliotecas nacionales tienen sus propios archivos webtambién.
Archive.today
Lanzado en 2012,Archive.today es una herramienta impulsada por el usuario que guarda páginas web sin elementos activos o scripts. Es ideal para archivar contenido dinámico como publicaciones en las redes sociales. Guarda enlaces funcionales. Y no es tan grande como la máquina Wayback, sino más personal y receptiva.
Pros: Rápido, fácil y gratis.
Contras: Confía en la iniciativa de usuario, un archivo más pequeño.
Perma.cc
Desarrollado por el Laboratorio de innovación de la biblioteca en la Universidad de Harvarden 2013, Perma.cc combate enlace pudrición Como este es “un gran problema, especialmente para la erudición académica y las opiniones judiciales, que dependen en gran medida de las citas a fuentes estables a las que los lectores pueden acceder”.
Archivado a través de Perma.cc, tEl sitio web se queda Interactivo, y los enlaces permanecen haciendo clic. Sin embargo, es gratuito para organizaciones afiliadas a instituciones académicas y tribunales. Otros deberán pagar una suscripción mensual.
Pros: Confiable para uso académico.
Contras: Acceso gratuito limitado.
Fantasquino
Lanzado en 2021, FantasquinoSe especializa en el archivo de videos y contenido dinámico, que a menudo se usa en las redes sociales, áreas donde otras herramientas a menudo luchan. Tiene una alta tasa de éxito con el contenido de video, pero no siempre es confiable.
Pros: Alta tasa de éxito con contenido de video.
Contras: No 100% confiable.
Una extensión de cromo llamado Archivos webTambién envuelve varias herramientas de archivo, lo que refleja la creciente necesidad de preservar el contenido en línea a medida que continúa expandiéndose.
¿Por qué el archivo importa?
Archiving ayuda a responsabilizar a las figuras públicas y rastrear cómo evolucionan sus declaraciones con el tiempo.
“Podemos compartir al menos el archivo digital de nuestra realidad”, dice Henk Van Ess, experto en investigación en línea e inteligencia de código abierto. “ILos políticos dicen algo hace muchos, muchos años y cambian su opinión, es muy importante averiguar lo que realmente dijeron. Entonces, es básicamente la mejor manera de compartir la realidad nuevamente “, explica.
Como Mark Graham, director de The Wayback Machine, lo puso en una entrevistacon el Financial Times: “No se trata de tratar de archivar las cosas que son verdaderas, sino archivar la conversación “.
Cuando el archivo se queda corto
No todas las páginas se archivan por igualy archivar todo el contenido en línea sería imposible. Los sitios populares se raspan regularmente, mientras que los más pequeños se archivan de manera más esporádica. Herramientas como Archive.today depende de los usuarios para iniciar el proceso de archivo.
“Cada hora, hay tanto material producido en la web que es técnicamente imposible copiarlo y pegarlo”, dice Van Ess. Además, Algunos sitios bloquean las herramientas de archivo utilizando configuraciones como robots.txt., Y otros pueden no estar vinculados desde cualquier lugar, haciéndolas invisibles para los rastreadores. Sa veces, problemas técnicos como errores de conexión o límites de datos puede prevenir Archivo exitoso.
“Uno de los mayores desafíos para el archivo web es capturar las páginas web dinámicas de hoy a escala”, dice Weigle.
Van Ess también advierte que las presiones legales pueden obstaculizar cada vez más el archivo: “WVive en un mundo, al menos en la democracia occidental, que está “abogado”. Si tiene críticas sobre lo que se ha argumentado, hoy en día es bastante fácil eliminarlo debido a las ramificaciones legales “.
La conclusión más importante es que el dicho: “¡Internet nunca olvida!” a menudo es cierto y podemos usarlo para nuestra ventaja, y encontrar versiones más antiguas de sitios web, o incluso sitios web eliminados, en los archivos de la red.
Editado por: Rachel Baig