IIPC-IFLA News Media Section Workshop: Web Archiving in Spanish

La IFLA News Media y el Consorcio Internacional para la Preservación de Internet (IIPC) se unen nuevamente para organizar una serie de talleres enfocados en el archivo de medios de comunicación. Dado que hoy en día la mayoría de las noticias se publican en línea, existe un interés creciente por comprender mejor las prácticas actuales y más eficaces para el archivado web. El objetivo principal de estos talleres es analizar y comparar cómo distintas organizaciones, de diversos tamaños y contextos,  abordan esta labor y aprender de sus experiencias. A través de presentaciones y conversaciones informales, se presentarán diferentes aproximaciones institucionales para archivar contenidos de medios de comunicación, incluidos los audiovisuales y los provenientes de redes sociales. También se destacarán los principales desafíos del campo y se explorarán soluciones innovadoras. The IFLA News Media and International Internet Preservation Consortium (IIPC) are teaming up again to host a series of workshops focusing on archiving news media. As most news is now published online, there is a growing interest to better understand the current best practices in web archiving. The main goal of our workshops is to examine and compare how organizations of varying sizes tackle this topic and to learn from their collective experiences. Through presentations and informal discussions, we will showcase diverse organizational approaches to archiving news media, including audiovisual content and social media, highlight key challenges, and explore innovative solutions.
En ediciones anteriores, hemos abordado temas como: 1) asos prácticos de tres bibliotecas nacionales sobre el archivo de noticias digitalizadas y nacidas digitales, 2) enfoques para rastrear noticias detrás de muros de pago mediante herramientas basadas en navegadores, con ejemplos de cuatro bibliotecas nacionales, e 3) estrategias para archivar contenidos audiovisuales de noticias. Our previous events featured: 1) use cases from three national libraries on archiving digitised and born-digital news, 2) approaches to browser-based crawling of news behind paywalls with examples from four national libraries, and 3) archiving audiovisual news media content.
Este taller estará dedicado al archivado web en español e incluirá una presentación sobre el uso de colecciones de archivos web como datos. La moderación estará a cargo de Natalia Márquez-Bustos (Pontificia Universidad Javeriana, Colombia). Todas las presentaciones se realizarán en español, con traducción automática disponible a través de Zoom. Además, los panelistas utilizarán diapositivas en formato bilingüe para facilitar la comprensión del público internacional. This edition will feature presentations about web archiving in Spanish-speaking countries and include a talk on web archive collections as data. The workshop will be moderated by Natalia Márquez-Bustos, Pontificia Universidad Javeriana (Colombia). All presentations will be in Spanish, but it will be possible to use automated translation in Zoom and the presenters will have bilingual slides.
AGENDA
10:00-10:10: Presentación de la sección de Medios de Comunicación de IFLA e IIPC
10:10-10:25: Preservar la memoria digital en español: El papel del Archivo de la Web Española
10:25-10:40: El archivado web como un método de acopio y creación de colecciones de datos para la investigación científica
10:40-10:55: Estrategias y avances de la Preservación web en México a través del Grupo de Preservación Digital (GDP)
10:55-11:00: Breve pausa
11:00-11:15: Iniciativa de recolección de la memoria web colombiana: la experiencia de la Biblioteca Nacional de Colombia
11:15-11:30: Archivo web basado en navegadores 
11:30-11:35: Colecciones de archivos web como datos
11:35-11:58: Preguntas y respuestas con todos los ponentes
11:58-12:00: Cierre
AGENDA
10:00-10:10: Introduction to IFLA News Media section + IIPC
10:10-10:25: Legal Deposit of the National Library of Spain. Preserving Digital Memory in Spanish: The Role of the Spanish Web Archive
10:25-10:40: Web Archiving as a method of collecting and creating data sets for scientific research purposes
10:40-10:55: Strategies and Advances in Web Preservation in Mexico through the Digital Preservation Group (GPD)
10:55-11:00: short break
11:00-11:15: Colombian Web Memory Collection Initiative: The Experience of the National Library of Colombia
11:15-11:30: Browser-based web archiving
11:30-11:35: Web archive collections as data
11:35-11:58: Q&A with all speakers
11:58-12:00: Wrap-up
PRESENTACTIONES PRESENTATIONS
José Carlos Cerdán Medina | Biblioteca Nacional de España: Preservar la memoria digital en español: El papel del Archivo de la Web Española José Carlos Cerdán Medina | National Library of Spain: Preserving Digital Memory in Spanish: The Role of the Spanish Web Archive
El español constituye una lengua con más de 600 millones de hablantes y se posiciona como la tercera más hablada a nivel mundial. En este contexto, el Archivo de la Web Española es una iniciativa de la Biblioteca Nacional de España, puesta en marcha en 2009 con el propósito de preservar los contenidos digitales presentes en Internet, así como las publicaciones que allí se albergan, con el fin de conservarlas para las generaciones futuras. En esta sesión se abordarán los principales hitos de este proyecto, así como el papel estratégico que el español y América Latina están llamados a desempeñar en el ámbito del archivado web, en el marco de la cooperación internacional. Spanish is a language spoken by over 600 million people and ranks as the third most widely spoken language in the world. In this context, the Spanish Web Archive is an initiative of the National Library of Spain, launched in 2009 with the aim of preserving digital content available on the Internet, as well as the publications hosted there, in order to safeguard them for future generations. This session will explore the key milestones of the project, as well as the strategic role that Spanish and Latin America are expected to play in the field of web archiving, within the framework of international cooperation.
José Carlos Cerdán Medina es Licenciado en Historia del Arte por la Universidad Autónoma de Madrid y tiene un Máster en Bibliotecas y Servicios de Información Digital por la Universidad Carlos III de Madrid. Ejerce como bibliotecario desde 2007, desarrollando su trayectoria profesional entre el Consejo Superior de Investigaciones Científicas (CSIC) y la Biblioteca Nacional de España (BNE). En esta última, trabaja como conservador web desde 2019 y, desde 2021, coordina el depósito legal digital y el Archivo de la Web Española. En este ámbito, ha participado en congresos internacionales y mesas redondas sobre humanidades digitales, depósito legal digital y archivado web, como el I Congreso Internacional de Humanidades Digitales (2022) organizado por la Universidad Católica de Valencia y la Universidad Católica de Ávila. Asimismo, ha intervenido en encuentros de carácter internacional, como las VII Jornadas de Intercambio y Reflexión sobre la Investigación en Bibliotecología (2024), organizadas por la Universidad Nacional de La Plata (Argentina), y la Web Archiving Conference 2025, celebrada en la Biblioteca Nacional de Noruega bajo la organización del IIPC. José Carlos Cerdán Medina holds a Bachelor’s Degree in Art History from the Autonomous University of Madrid and a Master’s Degree in Library and Digital Information Services from Carlos III University of Madrid. A librarian since 2007, he has developed his career between the Spanish National Research Council (CSIC) and the National Library of Spain. At the latter, he has worked as a web curator since 2019 and, since 2021, has coordinated the digital legal deposit and the Spanish Web Archive. In this field, he has participated in international conferences and round tables related to digital humanities, digital legal deposit, and web archiving. These include the 1st International Congress on Digital Humanities (2022), organized by the Catholic University of Valencia and the Catholic University of Ávila, as well as international events, such as the 7th Conference on Exchange and Reflection on Research in Library Science (2024), organized by the National University of La Plata (Argentina), and the latest edition of the Web Archiving Conference 2025, organized by the IIPC at the National Library of Norway.
Perla Olivia Rodríguez Reséndiz | Universidad Nacional Autónoma de México (UNAM): El Archivado Web como un método de acopio y creación de colecciones de datos para la investigación científica Perla Olivia Rodríguez Reséndiz | UNAM (México): Web Archiving as a method of collecting and creating data sets for scientific research purposes
Se presentará una introducción a las directrices para la planificación y puesta en marcha de iniciativas de archivado web, como un método de recopilación y creación de colecciones de datos para la investigación científica. Esta presentación se basa en la experiencia de preservación digital de contenidos Web sobre Covid 19 en México realizada en la Información de la Universidad Nacional Autónoma de México. This presentation will introduce the guidelines for planning and implementing web archiving initiatives as a method of collecting and creating data collections for use in scientific research. This presentation is based on the experience of digital preservation of web content on the topic of the Coronavirus (Covid-19) in Mexico, a project carried out at the Information of the National Autonomous University of Mexico.
Perla Olivia Rodríguez Reséndiz es Doctora en Ciencias de la Documentación por la Universidad Complutense de Madrid y es maestra en Ciencia Política y Licenciada en Ciencias de la Comunicación por la Universidad Nacional Autónoma de México (UNAM). Ha diseñado y producido series radiofónicas, televisivas y multimedia con fines educativos y culturales; y también ha creado y coordinado programas de formación y capacitación presencial y a distancia a nivel nacional e internacional en los ámbitos de la documentación sonora, audiovisual y multimedia en colaboración con instituciones educativas mexicanas y extranjeras. Actualmente es investigadora del Instituto de Investigaciones Bibliotecológicas y de la Información de la UNAM y hace parte de la News Media Section de la IFLA. Perla Olivia Rodríguez Reséndiz holds a PhD in Documentation Sciences from the Complutense University of Madrid and a Master’s degree in Political Science and a Bachelor’s degree in Communication Sciences from the National Autonomous University of Mexico (UNAM). She has designed and produced radio, television and multimedia series for educational and cultural purposes; and has also created and coordinated national and international education and training programs in the fields of sound, audiovisual and multimedia documentation in collaboration with Mexican and foreign educational institutions. She is currently a researcher at the Instituto de Investigaciones Bibliotecológicas y de la Información at UNAM. She is also part of the IFLA’s News Media Section.
Carolina Silva Bretón: Estrategias y avances de la Preservación web en México a través del Grupo de Preservación Digital (GPD) Carolina Silva Bretón: Strategies and Advances in Web Preservation in Mexico through the Digital Preservation Group (GPD)
Esta charla aborda los esfuerzos recientes en México para preservar la web, destacando las estrategias implementadas por el Grupo de Preservación Digital (GPD), liderado por la Biblioteca Nacional de México. Se presentarán los principales avances, así como los desafíos enfrentados en el contexto nacional. La sesión ofrecerá una visión integral del papel del GPD en la protección de la memoria digital mexicana.

This talk addresses recent web preservation efforts in Mexico, highlighting the strategies implemented by the Digital Preservation Group (GPD), led by the National Library of Mexico. The main advances and challenges faced in the national context will be presented. The session will offer a comprehensive overview of the role of the Digital Preservation Group (GPD) in protecting Mexico’s digital memory.Desde el 2023, es coordinadora de la temática de desarrollo “Preservación de sitios web” en el Grupo de Preservación Digital – México (GPD).
Carolina Silva Bretón Diseñadora web y Comunicadora Visual de profesión con especialidad en Audiovisual y Multimedia; cuenta con Maestría y Doctorado relacionado con Educación Superior. Ha desarrollado y diseñado sitios web por más de 17 años por lo que conoce varias tecnologías. Es Académica del Instituto de Investigaciones Bibliográficas, de la Universidad Nacional Autónoma de México (IIB-UNAM), la cual administra a la Biblioteca y Hemeroteca Nacionales de México. Desde el 2020 ha incursionado e investigado sobre la “Preservación de sitios web”. En ese año, desarrolló un proyecto piloto para la captura de sitios web desarrollados en su Instituto. La invitaron a colaborar en el proyecto “Preservación digital de contenidos publicados en portales web y redes sociales. Del acopio a la difusión de colecciones digitales Covid-19 en México”, impulsado por el Instituto de Investigaciones Bibliotecológicas y de la Información (IIBI-UNAM) entre 2021 y 2022. En 2024 y 2025, participó en la General Assembly & Web Archiving Conference del IIPC. Carolina Silva Bretón is a web designer and visual communicator, specialized in audiovisual and multimedia. She holds a Master’s and Doctorate related to Higher Education. She has developed and designed websites for over 17 years, and as such is familiar with several technologies. She is a member of the Institute of Bibliographic Research of the National Autonomous University of Mexico (IIB-UNAM), which oversees the National Library and National Newspaper Archive of Mexico. Since 2020, she has been actively engaged in research on web preservation, starting with a pilot project to capture websites developed within her Institute. Between 2021 and 2022, she was invited to collaborate on the project “Digital Preservation of Content Published on Web Portals and Social Media: From the Collection to the Dissemination of COVID-19 Digital Collections in Mexico,” promoted by the Institute for Library and Information Research (IIBI-UNAM). In 2024 and 2025, she participated in the IIPC General Assembly & Web Archiving Conference.Also, since 2023, she has coordinated the thematic line “Website Preservation” within the Digital Preservation Group – Mexico (GPD).
Lorena Ramírez-López | Webrecorder: Anatomía de una página web: Mejores prácticas de archivado web Lorena Ramírez-López | Webrecorder: Anatomy of a webpage: Best Practices of web archiving
Aunque la web existe desde hace más de treinta años, las tecnologías y métodos utilizados para construirla y preservarla siguen evolucionando constantemente, lo que representa nuevos desafíos para archivistas. Esta presentación destacará los retos actuales de  archivado web comenzando con la anatomía de una página web; presentará las mejores prácticas y los estándares reconocidos por la comunidad de archivado web; y finalmente ofrecerá consejos prácticos y técnicas para archivar la web utilizando herramientas accesibles y de código abierto como ArchiveWeb.page. Although the web has been around for more than thirty years, the technologies and methods used to build and preserve it are constantly evolving, bringing new challenges for archivists. This presentation will call attention to the challenges of web archiving beginning with the anatomy of a web page; highlight established best practices and widely accepted standards in the web archiving community; and finally offer quick tips, tricks, and to dos with web archiving using accessible open-source tools like Archiveweb.page.
Lorena Ramírez-López es una asesora especializada en la preservación digital dentro del sector G.L.A.M., desempeñándose como ingeniera de soluciones y redactora técnica educativa para Webrecorder, y como asesora de preservación digital con Myriad Consulting. Su trayectoria profesional abarca desde el trabajo en festivales de cine y producciones cinematográficas hasta la conservación y preservación de materiales audiovisuales, tanto en línea como fuera de ella. Originaria de Queens, New York, Lorena ha estado activa en eventos comunitarios e iniciativas de alcance en todo Estados Unidos, y ha colaborado internacionalmente en Argentina, Brasil, Chile, México y Uruguay. Su trabajo se centra en codificar y desarrollar herramientas que mejoren el acceso a los medios y el arte, con el objetivo de ampliar el alcance de la información dentro de comunidades diversas. Lorena Ramírez-López is a consultant specializing in digital preservation within the G.L.A.M. sector, serving as a solutions engineer and educational technical writer for Webrecorder, and as a digital preservation consultant with Myriad Consulting. Her professional journey ranges from working in film festivals and cinema productions to archiving and preserving audiovisual materials, on and offline. Originally from Queens, Lorena has been active in community events and outreach initiatives across the U.S., and has collaborated internationally in Argentina, Brazil, Chile, Mexico, and Uruguay. Her work centers on coding and developing tools that enhance access to media and art, aiming to broaden the reach of information within diverse communities.
Johanna Gallego Gutierrez | Biblioteca Nacional de Colombia: Iniciativa de recolección de la memoria web colombiana: la experiencia de la Biblioteca Nacional de Colombia Johanna Gallego Gutierrez | National Library of Colombia: The Colombian Web Memory Collection Initiative: The Experience of the National Library of Colombia
En esta charla se presentará el trabajo que la Biblioteca Nacional de Colombia ha desarrollado en el ámbito de la curaduría y recolección de la web colombiana. Se abordarán casos de éxito y aprendizajes obtenidos a partir de intentos fallidos de recuperación de contenidos digitales, así como las herramientas utilizadas para la recolección de sitios web relevantes para la historia reciente del país. También se compartirán los avances logrados en la legislación nacional, en relación con el depósito legal digital y el Decreto 0149 de 2024. This talk will present the work carried out by the National Library of Colombia in the curation and collection of the Colombian web. It will cover success stories and lessons learned from failed attempts to recover digital content, as well as the tools used to collect websites relevant to the country’s recent history. The presentation will also highlight the progress made in national legislation regarding digital legal deposit, including Decree 0149 of 2024. The talk offers a practical perspective on the history, challenges, achievements, and future directions of web archiving in Colombia, aimed at ensuring access to the nation’s digital memory for present and future generations.
Johanna Gallego es comunicadora social y periodista de la Universidad de la Sabana con maestría en Comunicación Transmedia de la Universidad Internacional de La Rioja. Está a cargo de los procesos de recolección de contenidos digitales y depósito voluntario y legal digital, desde el Grupo de Desarrollo de Colecciones de la Biblioteca Nacional de Colombia. Participó en el encuentro organizado por el IIPC en Londres, centrado en el intercambio de iniciativas internacionales de archivado web. En 2018, presentó el proyecto de archivado web del proceso de paz en Colombia en iPRES 2018, en la 15th International Conference on Digital Preservation, realizada en la Universidad de Harvard. En el 2024, participó en el Workshop 4 ” The Future of AI to Unlock Digital Records”, llevado a cabo en el Museo de Ciencias en Londres, en el cual se presentaron diversos proyectos de Inteligencia Artificial GLAMS (Galerías, Bibliotecas, Archivos y Museos). Desde el 2015 apoya en el proceso de reglamentación liderado por la Biblioteca Nacional de Colombia para la actualización de la reglamentación del depósito legal colombiano, así como proyectos e iniciativas para la recuperación del patrimonio bibliográfico y documental digital colombiano. Johanna Gallego is a journalist from Universidad de La Sabana with a Master’s degree in Transmedia Communication from Universidad Internacional de La Rioja. She is responsible for the digital content collection and voluntary and legal digital deposit processes at the National Library of Colombia, as part of the Collection Development Group. She participated in the IIPC – International Internet Preservation Consortium meeting in London, which focused on sharing international web archiving initiatives. In 2018, she presented Colombia’s web archiving project on the peace process at iPRES 2018, the 15th International Conference on Digital Preservation, held at Harvard University. In 2024, she took part in Workshop 4: “The Future of AI to Unlock Digital Records”, held at the Science Museum in London, where various AI-driven GLAM (Galleries, Libraries, Archives, and Museums) projects were presented. Since 2015, she has supported the regulatory process led by the National Library of Colombia to update the legal deposit legislation, as well as several projects and initiatives for the recovery of Colombia’s digital bibliographic and documentary heritage.
Gustavo Candela | Universidad de Alicante: Colecciones de Archivos Web como Datos Gustavo Candela | University of Alicante: Web Archive Collections as Data
“Web Archive Collections as Data” (WACAD) es una iniciativa que tiene como objetivo promover un método estandarizado para crear colecciones de archivos web como datos siguiendo buenas prácticas promovidas por instituciones y la lista de verificación para publicar colecciones como datos. Esta charla incluirá 1) el contexto actual (los principios de Collections as Data y la International GLAM Labs Community), 2) varios casos de uso, y 3) un resumen de los objetivos y resultados de varios talleres basados en WACAD presentados en 2025 como IIPC Web Archiving Conference en Oslo y Digital Humanities of the Nordic Countries en Tartu. Web Archive Collections as Data (WACAD) is an initiative that aims to propose a standardised method for making web archive collections as data available based on current practices at web archiving institutions and the Labs checklist for publishing collections as data. This short talk will provide 1) the context for our work (the Collections as Data principles and the International GLAM Labs Community), 2) different use cases, and 3) a summary of our objectives and deliverables based on the WACAD workshops delivered at the 2025 IIPC Web Archiving Conference in Oslo and the Digital Humanities of the Nordic Countries in Tartu.
Gustavo Candela ha realizado labores de investigación y desarrollo en la Biblioteca Virtual Miguel de Cervantes hasta 2023. Actualmente es Profesor Ayudante Doctor en el Departamento de Lenguajes y Sistemas Informáticos. Sus áreas de investigación son la búsqueda y recuperación de información, así como la Web Semántica, la publicación de datos abiertos y collections as data. Ha participado activamente en la International GLAM Labs Community y el centro de competencia en digitalización Impact. Ha colaborado con numerosas organizaciones e iniciativas como la Biblioteca Nacional de Escocia, Europeana, LIBER, British Library, Columbia University, Poznan Supercomputing and Networking Center y DARIAH-EU. Gustavo Candela is a Lecturer in Computer Science at the University of Alicante, where he received his PhD in Computer Science. Until 2023, he was a member of the IT department at the Biblioteca Virtual Miguel de Cervantes. His main areas of research interest are Information Retrieval, Semantic Web, and Collections as Data. He has worked with and published on the integration and quality of Linked Open Data in libraries, as well as Collections as Data and Jupyter Notebooks using datasets provided by several GLAM institutions. He is involved in the International GLAM Labs Community and has closely collaborated with institutions and initiatives including the National Library of Scotland, Europeana, LIBER, British Library, Columbia University, Poznan Supercomputing and Networking Center, and DARIAH-EU.
Moderadora: Natalia Márquez-Bustos, Pontificia Universidad Javeriana (Colombia) Moderator: Natalia Márquez-Bustos, Pontificia Universidad Javeriana (Colombia)
Profesora e investigadora del Departamento de Ciencia de la Información en la Pontificia Universidad Javeriana (Bogotá, Colombia). Cuenta con un máster en Relaciones Internacionales y formación en Ciencia de la Información de la misma universidad. Su carrera combina la docencia, la investigación y el liderazgo académico, centrándose en la toma de decisiones basada en datos y la formulación de políticas. Ha trabajado con instituciones como el Observatorio Colombiano de Ciencia y Tecnología, la Universidad del Rosario, la Alcaldía de Bogotá y el PNUD. Actualmente investiga sobre métricas alternativas, métodos digitales y acceso abierto en América Latina. Professor and researcher in the Department of Information Science at the Pontificia Universidad Javeriana (Bogotá, Colombia). She has a master’s degree in International Relations and a background in Information Science from the same university. Her career combines teaching, research, and academic leadership, focusing on data-driven decision-making and policy formulation. She has worked with institutions such as the Colombian Observatory of Science and Technology, Universidad del Rosario, the Bogotá City Hall, and the UNDP. Currently, she conducts research on alternative metrics, digital methods, and open access in Latin America.
RESOURCES:

IFLA NEWS MEDIA SECTION

IIPC

FROM TODAY’S SPEAKERS:

The event is finished.

Tags:

Date

17 Jun 2025
Expired!

Time

2:00 PM - 4:00 PM

Local Time

  • Timezone: America/New_York
  • Date: 17 Jun 2025
  • Time: 10:00 AM - 12:00 PM

More Info

REGISTER HERE

Next Event