Merci à Arnaud Delivet, OCLC, pour la traduction de l’article original en anglais.
Cet article de blog revient sur la table ronde en français organisée par le département recherche d’OCLC le 3 mars 2021 dans le cadre de sa Série de discussions sur les métadonnées de prochaine génération.
Les participants – issus des domaines du contrôle bibliographique, des services de catalogage, de la gestion de l’information sur la recherche (RIM), des archives et des collections patrimoniales – ont rejoint la session en provenance de France, de Belgique, d’Allemagne et d’Italie, formant un groupe très hétérogène. Comme lors de toutes les autres tables rondes, les participants ont commencé par donner un aperçu des projets liés aux métadonnées de prochaine génération en cours dans leur région.
L’exercice de cartographie
La carte résultante reflète bien ce qui était au cœur des préoccupations du groupe. Elle met en exergue le Fichier National d’Entités français (FNE), projet phare du Programme de transition bibliographique national, mené conjointement par la Bibliothèque nationale de France (BnF), et l’Agence bibliographique de l’enseignement supérieur (Abes). Un groupe de projets faisant partie de ce même programme occupe le quadrant supérieur gauche de la carte. Un regroupement intéressant d’étiquettes est apparu autour du centre de la carte, toutes relatives aux identifiants persistants, démontrant l’importance qui leur est attribuée et reflétant leur domaine d’application (données bibliographiques; données de gestion de l’information sur la recherche (RIM) et communications savantes; données patrimoniales). En comparaison, relativement peu de projets figurent dans les quadrants RIM ou patrimoniaux.
Possibilité de pollinisation croisée
Le groupe a ensuite partagé des informations sur les principaux projets présents sur la carte. Un participant a expliqué comment les deux principales agences bibliographiques françaises, la BnF et l’Abes, ont été amenées à collaborer en réponse à une délimitation moins stricte entre production de métadonnées et flux d’utilisation. Celle-ci résulte de la politique française d’ouverture des données publiques qui favorise la publication et la réutilisation de ces données. En conséquence, les deux agences ont décidé de rassembler leurs données et de coproduire des données bibliographiques à l’avenir, afin de profiter des avantages de la centralisation et de la normalisation pour gagner en efficacité au moment de la production et de la publication. Le FNE est la base centrale dans laquelle les deux organisations cocréeront des entités et est considéré comme la première mise en œuvre à grande échelle du Library Reference Model de l’IFLA. D’autres bibliothèques et archives françaises pourront, à terme, contribuer à cette base de connaissances pour qu’elle devienne véritablement une entreprise nationale.
Un autre participant a clarifié le statut du paysage RIM français et décrit deux initiatives infrastructurelles qui consistent à collecter des métadonnées pour permettre le suivi et l’évaluation de la recherche scientifique:
- CapLab, un système dans le cloud déployé par l’Amue (Agence de Mutualisation des Universités et Établissements) pour évaluer les projets de recherche.
- HALliance, un grand projet d’investissement porté par le CCSD (Le Centre pour la Communication Scientifique Directe) qui a pour but de développer la prochaine génération de l’Archive Ouverte HAL, avec une approche centralisée de l’analyse et de l’évaluation de la recherche.
Il semble y avoir peu de pollinisation croisée entre les initiatives nationales liées aux données de gestion de l’information sur la recherche et celles portant sur les données bibliographiques en France, et il a été observé que combler cet écart pourrait ouvrir de nouvelles opportunités. euroCRIS, l’organisation internationale pour le développement des systèmes d’information de recherche (CRIS) – qui gère également le modèle de données CERIF – rassemble différentes parties prenantes de la communauté RIM et pourrait être une voie vers d’autres explorations collaboratives. Et c’était bien sûr exactement l’objectif de cette session: partager, connecter et rapprocher.
Transcender le niveau institutionnel
Le paysage belge a été décrit comme très différent du paysage français, même si l’objectif d’ouvrir les collections sur le Web des données est le même. La centralisation y est moindre et les institutions nationales – telles que les Archives d’État ou la Bibliothèque Royale – ont eu tendance à poursuivre leur propre travail traditionnel sur les autorités. Cependant, il a également été noté que la Bibliothèque Royale a endossé le rôle d’agence d’enregistrement ISNI pour les auteurs en Belgique et envisage de publier un fichier d’autorité national pour les noms d’auteurs avec leurs identifiants ISNI, VIAF et d’autres. Cet effort sera en outre étendu grâce à une collaboration avec d’autres bibliothèques belges.
Le passage à un niveau supérieur de gestion des métadonnées pour les bibliothèques universitaires à titre individuel a été décrit comme problématique pour diverses raisons. Tout d’abord, il est nécessaire d’harmoniser les autorités de noms d’auteurs dans différents systèmes, tels que le dépôt institutionnel, le catalogue et les collections numériques. Cependant, la mise en place d’un fichier d’autorité local centralisé pose ses propres problèmes de synchronisation. A cela s’ajoute la difficulté de choisir parmi les nombreux identifiants d’auteurs existants et de décider lesquels sont pertinents pour vos collections. Un moyen pratique et attrayant de surmonter ces problèmes consiste à se connecter à l’un des grands fichiers d’autorité internationaux, tels que le Name Authority File (NAF) de la Bibliothèque du Congrès, qui sont enrichis avec tous les identifiants pertinents et mis à jour automatiquement.
Le défi que pose la gestion de différentes échelles
Du point de vue français, la gestion des métadonnées de nouvelle génération à l’échelle nationale fait sens pour plusieurs raisons. Premièrement, en raison de la nécessité de respecter les principes et missions bibliographiques français. Plus précisément, la BnF et l’Abes sont attachées à la distinction entre «l’oeuvre» et «l’expression». Cette distinction est moins nette dans la tradition bibliographique anglo-saxonne. De plus, dans les grandes bases de connaissances internationales, les définitions des concepts relatifs à l’identité des personnes (par exemple, «identité publique») sont encore en évolution. Deuxièmement, la France est à la pointe en matière de gestion des autorités. Les liens entre les autorités et les notices bibliographiques ne sont pas basés sur des chaînes de caractères, mais sur des identifiants. Le passage au paradigme des entités interconnectées est donc relativement facile à faire. Les membres du groupe ont clairement indiqué qu’investir dans une infrastructure bibliographique à l’échelle nationale ne signifiait pas que les données étaient cloisonnées. Au contraire, les données seront interopérables, accessibles et réutilisables au niveau international. C’est à cela que servent les normes internationales. En fin de compte, l’échelle nationale est la meilleure pour débuter, car – comme l’a dit l’un des participants :
«Le global ne peut être alimenté que par le local, en termes de culture, en termes de consolidation de l’entité (…) nous avons la responsabilité, les connaissances et le savoir-faire au niveau local pour gérer les entités que sont les auteurs français (…), nous sommes les mieux qualifiés pour identifier et consolider ces entités qui requièrent un savoir local».
Dans le domaine RIM, l’échelle nationale est également incontournable pour des raisons historiques et culturelles françaises. Cependant, en raison de la nature de la recherche scientifique, deux autres échelles ont été décrites comme d’égale importance: l’échelle européenne et celle de la communauté disciplinaire. La première est motivée par les politiques de science ouverte et «une nébuleuse de projets et de groupes de travail financés par l’UE qui façonnent des infrastructures de données de recherche ouvertes». Le second est caractérisé par des pratiques de métadonnées extrêmement spécialisées. Toutes ces différentes échelles doivent être gérées de concert, ce qui représente un véritable défi.
Ce fut une conclusion révélatrice de cette table ronde, rappelant à chacun qu’il existe de multiples «bonnes échelles» coexistantes pour les métadonnées de prochaine génération, qui doivent être interconnectées et gérées dans leur ensemble.
À propos de la série de discussions du département recherche d’OCLC sur les métadonnées de nouvelle génération
En mars 2021, OCLC Research a mené une série de discussions basée sur deux rapports:
- “Transitioning to the Next Generation of Metadata”
- “Transforming Metadata into Linked Data to Improve Digital Collection Discoverability: A CONTENTdm Pilot Project”.
Les tables rondes se sont déroulées dans différentes langues et les participants ont pu partager leurs expériences propres, mieux comprendre le sujet et se préparer pour l’avenir en toute confiance.
La séance plénière d’ouverture a lancé le forum de discussion et d’étude et a permis de présenter le thème et les sujets abordés. Les résumés des huit tables rondes sont publiés sur le blog d’OCLC Research, Hanging Together. Cet article est le quatrième de cette série, et fait suite à ceux consacrés à la première session en anglais, à la session en italien et à la deuxième session en anglais.
La séance plénière de clôture du 13 avril fera la synthèse des différentes tables rondes. Les inscriptions restent ouvertes pour ce webinaire: Rejoignez-nous!
Titia van der Werf is a Senior Program Officer in OCLC Research based in OCLC’s Leiden office. Titia coordinates and extends OCLC Research work throughout Europe and has special responsibilities for interactions with OCLC Research Library Partners in Europe. She represents OCLC in European and international library and cultural heritage venues.