Research, Services, and Tools for Accessing Web Archives Series: Accessing and Using Web Archives Data and Metadata

en français:

Cycle de rendez-vous francophones en ligne d’IIPC “Recherche, services et outils d’accès aux archives web”

Ce premier cycle de quatre rendez-vous thématiques, dédiée aux outils pour l’accès aux collections et la recherche, se tiendra en ligne et exclusivement en français. Il a pour objectif:

  • de partager de l’information sur les projets en cours concernant l’accès et la recherche dans les institutions francophones d’IIPC,
  • de présenter des cas d’usages, des outils et des services utilisés par les différentes institutions,
  • de discuter des questions juridiques, notamment dans les cadre des réglementations européennes.

NB: les rendez-vous sont en français mais sont ouverts à toute personne intéressée. Les fonctions de transcription et traduction automatisées peuvent être utilisées pour faciliter la compréhension des échanges.

Format

Les rendez-vous durent entre 1h00 et 1h30 et comprennent une ou plusieurs présentations en lien avec le sujet suivies d’un temps de questions réponses et d’échanges.

In English:

This thematic regional online series, “Research, Services, and Tools to Access Web Archives,” will consist of 4 sessions, all conducted in French, and target mainly Luxembourg, Belgium, Switzerland, Canada and France. Its purpose is to:

  • Share information about current projects regarding research and access to collections at French-speaking IIPC member institutions
  • Present use cases, new tools, and services
  • Discuss local legal possibilities with respect to EU regulations

Format:

Each event will be 1 to 1.30 hours including one or two thematic presentations followed by a Q&A and knowledge exchange.

Please note that even though the events will be held in French, anyone can participate as automated captions can be used for other languages. The translations may not be perfect but they should help understand the main points of the presentations.


Ce rendez-vous | This Session:

Rendez-vous n°3: le lundi 15 septembre (15h00-16h30) | 15 September (3-4.30 pm CET)

Accès, utilisation et extraction des (méta)donnée issues des archives du web: enjeux techniques et juridiques | Accessing and Using Web Archives Data and Metadata: Technical and Legal Aspects

en français:

Cette session comprendra deux présentations, la première davantage focalisée sur les aspects techniques de l’extraction de données, la seconde centrée sur ses aspects juridiques.

Sara Aubry et Dorothée Benhamou-Suesser présenteront l’application Webkit. Développée par la BnF pour répondre aux demandes de fourniture de données émanant des producteurs de sites web et des projets de recherche, cette application réunit plusieurs utilitaires permettant d’extraire sous différents formats les données archivées ou les métadonnées qui les accompagnent. Webkit répond également à des besoins internes d’extraction de données pour valoriser, signaler et interfacer les archives du web. Cette session sera l’occasion de présenter et d’échanger sur ces demandes, les services proposés et les défis que représente l’extraction de contenus à partir d’une archive de plus de 2,5 Po de données.

Intervenantes
  • Sara Aubry est responsable technique de l’archivage du web à la BnF
  • Dorothée Benhamou-Suesser est responsable de l’accès et de la préservation au sein du service du Dépôt légal numérique

La seconde présentation aura pour objectif de présenter le cadre juridique auquel sont soumis l’accès et l’utilisation de (méta)données issues des archives du web, en particulier au regard de la réglementation actuelle relative à la fouille de données. La fouille de texte et de données constitue une exception au régime du droit d’auteur qui permet en effet, à certaines conditions, de reproduire du contenu protégé. L’exposé visera à expliciter ces conditions et à évaluer la pertinence de cette exception dans le cadre des archives du web. Il sera suivi d’une discussion ouverte sur les pratiques des différentes institutions en la matière.

Intervenante
  • Elodie Lecroart – Chercheuse au CRIDS (Centre de Recherche Information, Droit et Société – Université de Namur) et partenaire de la KBR dans le cadre du projet Belgicaweb
In English:

This session will include two presentations, the first focusing more on the technical aspects of data extraction, the second focusing on its legal aspects.

Sara Aubry and Dorothée Benhamou-Suesser will present the Webkit application. Developed by the BnF in response to requests for data from website producers and research projects, this application brings together several utilities that can be used to extract web archived data or metadata in various formats. Webkit also meets internal needs for data extraction to promote, create records, and interface with web archives. This session will provide an opportunity to present and discuss these requests, the services offered, and the challenges involved in extracting content from a web archive of more than 2.5 PB of data.

Presenters
  • Sara Aubry – Web Archiving Technical Lead at the BnF
  • Dorothée Benhamou-Suesser is responsible for access and preservation within the BnF’s Digital Legal Deposit service

The second presentation will aim to outline the legal framework governing access to and use of (meta)data from web archives, particularly with regard to current regulations on data mining. The TDM exception is an exception to copyright law that allows, under certain conditions, the reproduction of protected content. The presentation will aim to explain these conditions and assess the relevance of this exception in the context of web archives. This will be followed by an open discussion on the practices of different institutions in this respect.

Presenter
  • Elodie Lecroart – Researcher at CRIDS (Research Centre in Information, Law and Society – University of Namur) and partner of the KBR in the Belgicaweb project

Prochains rendez-vous | Next Session: 

Rendez-vous n°4: en novembre, date à confirmer | November, to be scheduled

Interfaces et fonctionnalités d’accès aux collections d’archives web: l’exemple d’e-Helvetica et de Belgica Web Project | Giving Access to Collections: Platforms and Functionalities (Use Cases: e-Helvetica at Swiss National Library and the BelgicaWeb Project)

The event is finished.

Date

15 Sep 2025
Expired!

Time

1:00 PM - 2:30 PM

Local Time

  • Timezone: America/New_York
  • Date: 15 Sep 2025
  • Time: 9:00 AM - 10:30 AM

More Info

REGISTRATION

Labels

In French

Location

Online

Next Event