Gracias a Francesc García Grimau, OCLC, que amablemente ha proporcionado la versión en español de esta entrada de blog. La versión en inglés está disponible aquí.
Esta publicación es parte de una serie de posts para informar de las conversaciones sobre la transición a la próxima generación de metadatos en España, esta vez centrándose en el patrimonio cultural. Mi compañero Francesc García Grimau de la oficina de OCLC en España y yo fuimos los anfitriones de la sesión del 19 de enero de 2022.
Los principales actores y proyectos que identificaron nuestros participantes de la primera mesa redonda española fueron invitados en ella. Entre ellos participaron representantes de la Biblioteca Nacional de España, el Ministerio de Cultura, la Universidad de Alicante, el Museo del Prado, bibliotecas digitales de diferentes regiones y colecciones del país (por ejemplo, la Memoria Digital de Cataluña, la biblioteca virtual Miguel de Cervantes) y bibliotecas universitarias con grandes colecciones especiales (por ejemplo, la Universidad de Barcelona o la Universidad Complutense de Madrid).
Para estimular el debate, dos oradores invitados iniciaron la sesión:
- Elena Sánchez, responsable del Servicio de Innovación y Reutilización Digital de la Biblioteca Nacional de España (BNE), que presentó el proyecto de metadatos de próxima generación más estratégico de la BNE
- Liz Krznarich, Gerente de Adopción de DataCite & ROR, quien presentó sobre identificadores persistentes en el patrimonio cultural. Existe una necesidad creciente por hacer que las colecciones de patrimonio digital y sus objetos sean más citables y detectables, y su reutilización más rastreable. Pueden leer el resumen de su presentación en su publicación invitada en HangingTogether.
BNElab: el proyecto estratégico de metadatos de próxima generación de la Biblioteca Nacional de España
Elena Sánchez presentó BNElab. Este proyecto explora nuevas formas de uso de los recursos digitales y conjuntos de datos de la biblioteca. Responde a las políticas y estrategias de datos abiertos gubernamentales de España, en particular el llamado a compartir datos del sector público de manera amplia y proactiva, con el fin de dar a todos la oportunidad de valorarlos y obtener valor de ellos. En la última década, la biblioteca ha emprendido este proceso masivo de publicación y remodelación de todos sus registros bibliográficos y de autoridad, y colecciones digitales para su reutilización. Los conjuntos de datos resultantes se han convertido a formatos reutilizables, no específicos de las bibliotecas, y se han puesto a disposición en el dominio público (CC0) a través de los portales de datos de la biblioteca (BNElab/datos), el gobierno español (Datos.gob.es) y la Unión Europea (Data.Europa.eu).
A partir de 2017, la biblioteca inició múltiples proyectos de participación en el contexto de BNElab para atraer a diferentes comunidades a utilizar los conjuntos de datos de maneras nuevas y creativas. BNEscolar, por ejemplo, promueve el uso del patrimonio cultural en la enseñanza y el aprendizaje escolar. Elena explicó cómo la plataforma comunitaria BNE inscribe a los ciudadanos en proyectos de crowdsourcing para mejorar y enriquecer las descripciones de la biblioteca de los elementos del patrimonio cultural y los registros de autoridad. Además de aprovechar el conocimiento de los ciudadanos españoles, la biblioteca también se conecta a grafos de conocimiento, como Wikidata, por ejemplo, para agregar nuevos datos a gran escala a su catálogo (p.ej., lugar de nacimiento y ocupación de personas históricas). La BNE busca continuamente aprovechar al máximo sus datos, buscando nuevas formas de enriquecimiento y uso. Elena puso el ejemplo del proyecto MarIA que creó un modelo basado en IA en lengua española, entrenado con los ficheros del archivo web de la BNE. Es el primer modelo a gran escala que puede entender y escribir en español. Se puede utilizar en aplicaciones lingüísticas como predictores, correctores, chatbots, búsquedas inteligentes o subtitulado automático.
Hablando sobre el futuro de los servicios basados en estos nuevos recursos y formatos de datos, Elena agregó que será muy importante proporcionar servicios más personalizados a los investigadores para ayudarlos a comprender e interrogar los datos. Para esto, los profesionales de la biblioteca necesitarán formación, herramientas y estrategias para escalar dichos servicios, dijo Elena.
BNElab tiene muchos de los ingredientes que caracterizan los proyectos de metadatos de próxima generación: transformar cadenas descriptivas basadas en texto en datos reutilizables por ordenadores, embarcarse en el enriquecimiento semántico y la interconexión del conocimiento codificado en datos sobre obras en español y sus autores en toda la Web, construyendo comunidades de conocimiento en torno a conjuntos de datos y formando al personal de todos los departamentos de la biblioteca a través del aprendizaje práctico. Elena reflexionó sobre las muchas preguntas planteadas por el proyecto BNElab, preguntas que surgieron durante el debate.
Debate
Sobre el fomento de la participación de las comunidades
¿Cómo llegar a las comunidades adecuadas y mantenerlas comprometidas con los proyectos? Elena explicó que se trata de hacer coincidir la oferta y la demanda. Buscar grupos interesados en la historia de la publicidad, por ejemplo, para hacerlas coincidir con su colección de anuncios históricos. Una llamada general al público no siempre funciona. Uno tiene que contactarlos, guiarlos, comprender sus intereses y emparejarlos con otros que tienen conocimientos valiosos para que los usuarios puedan aprender unos de otros.
Sobre la calidad de las contribuciones realizadas pro la comunidad
Y, ¿cuánto tiempo se dedica a revisar y validar las contribuciones de la comunidad a través de los proyectos de BNElab? Elena observó que en general la calidad de las contribuciones ciudadanas es muy buena y se considera igual a la calidad de otras fuentes, como Wikidata. Los colaboradores validan las contribuciones de los demás. El tiempo dedicado a la validación por parte del personal de la biblioteca depende en gran medida del tipo de proyectos. La colaboración con el personal técnico del departamento de catalogación en estos temas es buena y no se oponen a incorporar los enriquecimientos derivados del crowdsourcing de nuevo en el catálogo de la biblioteca. Elena dijo que debido a la pandemia, los proyectos han tenido una participación masiva y será un desafío mantener ese nivel de compromiso:
“Creo que la gente se aburría mucho en casa y bueno, todos nos aburríamos mucho. En 2020 todos los proyectos se abrían y cerraban en 24 horas. De verdad, sacábamos proyectos y enseguida decíamos, oye, ya se ha cerrado, ¡no me lo puedo creer!”
Sobre la comprensión de las experiencias de los usuarios
Con tal variedad de usuarios en BNElab, ofrecer mejores interfaces y visualizaciones de consulta de datos es una prioridad en la agenda de la BNE. La transformación de registros del catálogo a conjuntos de datos les ha hecho reflexionar sobre la granularidad, calidad y utilidad de los datos.
“Es hora de investigar cómo se utilizan estos nuevos formatos, (…) cómo respondieron nuestros datos a las preguntas que se hacían los investigadores que trabajan exclusivamente con este tipo de recursos (…) investigadores que a partir de un fichero quiere extraer información(…). ¿Son capaces nuestros datos de responder a esta consulta por esos medios?”
Sobre la interconexión de colecciones en España
La BNE quiere reforzar los vínculos entre sus colecciones y otras fuentes de datos españolas, ya sean de contenido patrimonial o de contenido científico. El grupo debatió sobre la conveniencia de conectar las colecciones de la BNE, la Biblioteca Virtual Miguel de Cervantes, la biblioteca digital Hispana, la Biblioteca Virtual de Prensa Histórica y otros. Esto podría hacerse a través de identificadores de registros de autoridad y de los tesauros del patrimonio cultural mantenidos por el Ministerio de Cultura. El Ministerio ha transformado los tesauros en datos enlazados y actualmente está explorando las interconexiones que sería de interés perseguir. La obtención de registros del Catálogo Colectivo del Patrimonio Bibliográfico español con los de las distintas bibliotecas digitales españolas podría, por ejemplo, enriquecer enormemente los registros bibliográficos. Elena y sus compañeros han experimentado con enriquecer los metadatos de la BNE con términos de los tesauros del Ministerio, el vocabulario controlado del Instituto de Ciencias y Artes Audiovisuales y términos altamente especializados de otros vocabularios en lengua española. Ven interesantes oportunidades para agregar granularidad y especificidad más acurada a sus descripciones.
Sobre moverse a diferentes ritmos
El grupo observó que las instituciones patrimoniales en España no están todas evolucionando al mismo ritmo; algunas están lidiando con retrasos tecnológicos debido a sus aplicaciones de gestión de colecciones que aún no están listas para soportar las funcionalidades necesarias. Otras no tienen los medios o habilidades para convertir sus datos en datos enlazados. Actualmente es un entorno de madurez mixta y lo será durante un tiempo. Esto limita las posibilidades de interconexión de colecciones en España.
Continuará…
El tiempo voló y, de nuevo, tuvimos que terminar el debate prematuramente. Este es sin duda un debate que debe continuar. Trabajaremos con voluntarios de este grupo en un documento que consolide los resultados de esta y anteriores sesiones. ¡Y estamos preparando la próxima sesión sobre la cadena de suministro de libros (no académicos), que reunirá a diferentes actores alrededor de la mesa para otra conversación completamente diferente!
Titia van der Werf is a Senior Program Officer in OCLC Research based in OCLC’s Leiden office. Titia coordinates and extends OCLC Research work throughout Europe and has special responsibilities for interactions with OCLC Research Library Partners in Europe. She represents OCLC in European and international library and cultural heritage venues.