Ajout de métadonnées

4C. Métadonnées de conservation

Peu de référentiels sont actuellement capables de prendre en charge la totalité des métadonnées de conservation. Les créateurs de systèmes qui comportent de telles métadonnées doivent répondre aux questions suivantes :

Éléments : Quelles métadonnées seront créées et quels attributs des objets seront importants dans l'avenir?
Le modèle OAIS ne fournit qu'un cadre conceptuel des métadonnées de conservation. Plusieurs groupes et institutions dans le monde ont défini et spécifié des métadonnées à partir de ce cadre. Chacun a adopté une approche légèrement différente et a défini des métadonnées différentes. Voici quelques jeux de métadonnées proposés par certaines de ces organisations :

>> OCLC : Digital Archive Metadata Elements [Métadonnées d'archives numériques]
>> Groupe de travail du RLG et d'OCLC : A Metadata Framework to Support the Preservation of Digital Objects [Un cadre de métadonnées à l'appui de la conservation d'objets numériques]
>> Bibliothèque nationale d'Australie : Guidelines for the Preservation of Digital Heritage [Lignes directrices pour la conservation du patrimoine numérique]
>> Bibliothèque nationale de Nouvelle-Zélande : Metadata Standards Framework [Cadre des normes relatives aux métadonnées] (en deux parties, intitulées respectivement Metadata Implementation Schema [Schéma de mise en œuvre des métadonnées] et Preservation Metadata [Métadonnées de conservation])
>> Bibliothèque de l'Université Cornell : Proposed Metadata Elements [Métadonnées proposées]

Création : Qui se chargera de créer les métadonnées?
Le processus le plus efficace et le plus exact commence par un cadre commun utilisé par le producteur et par les Archives. L'intervenant qui est le plus près de l'information à utiliser comme métadonnée ajoute cette information au cadre. Par exemple, c'est le créateur d'un objet numérique qui connaît le mieux les données techniques relatives à la création de l'objet. Le degré d'exactitude optimal sera atteint si le producteur ajoute au cadre les métadonnées techniques préalables à l'entrée. L'information de contexte et l'information d'intégrité sont également connues au moment de la création de l'objet. D'autre part, les Archives possèdent des métadonnées communes à de nombreux objets, par exemple les normes de format. Le processus est plus efficace si les Archives ajoutent des pointeurs ou des liens à partir des différents objets vers les métadonnées communes. Le producteur n'a donc pas à créer des occurrences redondantes de métadonnées communes à tous les objets.

Processus manuel ou automatique?
Il se peut que le producteur et les Archives doivent produire manuellement certaines métadonnées mais, là encore pour des raisons d'efficacité, il faudrait viser la production automatique des métadonnées. Le logiciel METAe est un exemple d'outil de production semi-automatisée de métadonnées de conservation. Le bulletin DigiNews, vol. 6, no 3, donne une description de ce projet et de l'information sur son moteur de métadonnées.

Interface : Comment les métadonnées vont-elles du créateur au référentiel?
En un mot, la réponse est la « négociation ». Pour répondre de façon plus élaborée, disons que le producteur et les Archives doivent passer un accord qui définit les moyens de transmission, le processus de vérification et le processus par lequel les Archives peuvent demander une nouvelle transmission. Autrement dit, les deux parties peuvent s'entendre sur des moyens de livraison des fichiers. Les fichiers doivent être vérifiés à leur arrivée dans le référentiel. Les Archives peuvent les vérifier au regard des contrôles de parité envoyés par le producteur. Les Archives sont alors en mesure de signaler les éventuels problèmes au producteur et d'obtenir des fichiers en bon état.

Comment des métadonnées sont-elles demandées et obtenues par un utilisateur?
Les navigateurs Web et les formulaires en HTML constituent l'interface la plus répandue, mais on peut aussi recourir à un logiciel spécialisé. Un référentiel peut aussi créer un processus avisant certains utilisateurs de la création ou de la modification d'objets ou de métadonnées, selon un calendrier pré-établi ou à l'occasion d'événements particuliers.

Ajout de métadonnées -- Impression de métadonnées XML conformes à la norme METSStockage : Comment les métadonnées seront-elles stockées?
Comme les référentiels numériques actuels ne prennent pas en charge la gamme complète des métadonnées de conservation, les services d'archives doivent créer leurs propres mécanismes de stockage des métadonnées. Trois types de stockage numérique sont possibles : des fichiers indépendants, un SGBD (système de gestion de bases de données) ou des métadonnées incluses dans les objets eux-mêmes. La méthode des fichiers indépendants est la plus simple : elle consiste à enregistrer les métadonnées dans des fichiers de texte (souvent avec des balises XML). Le lien entre les métadonnées et les objets numériques est réalisé par des identificateurs permanents. L'encadré ci-dessous sur la norme METS (Metadata Encoding and Transmission Standard [Norme de codage et de transmission de métadonnées]) présente un exemple de cadre XML qui permet d'organiser des objets numériques dans un fichier de texte contenant des balises. Un SGBD est techniquement plus exigeant mais a l'avantage de pouvoir contenir un modèle relationnel d'objets complexes. La troisième méthode, l'inclusion de métadonnées directement dans les objets, est possible avec certains formats de fichier. À titre d'exemple, le format TIFF a la place et les fonctions requises pour enregistrer des métadonnées dans l'en-tête de fichier.

Mises à jour : Si un objet est touché par une modification, comment les métadonnées sont-elles modifiées?
Au minimum, il faut consigner la modification sous forme d'information de provenance. Si l'objet est déplacé, il faut mettre à jour divers pointeurs. Il se peut que des messages soient envoyés aux producteurs, aux utilisateurs et à l'administration du référentiel. Un principe souhaitable est celui de la cohérence : les modalités de modification et de documentation devraient être les mêmes pour un ensemble cohérent d'objets.

 
La norme METS (Metadata Encoding and Transmission Standard [Norme de codage et de transmission de métadonnées])

La norme METS définit un cadre XML souple conçu pour le stockage de métadonnées administratives, structurales et descriptives sur des objets numériques. En plus d'encapsuler les métadonnées elles-mêmes (ou les pointeurs vers des métadonnées stockées à l'extérieur des objets METS), ce cadre fournit des éléments de description des relations entre les métadonnées et entre les parties d'objets complexes. De plus, il fournit des balises permettant de décrire et de relier des comportements exécutables pertinents pour le contenu des objets METS. En bref, ce cadre constitue un conteneur XML pour tous les types de métadonnées, pour les relations entre elles et avec les objets sur lesquels elles portent, ainsi que pour les comportements associés aux objets. Grâce à son exhaustivité et à la souplesse de sa structure, METS constitue un excellent choix de cadre ou conteneur pour les objets et leurs métadonnées dans un système de conservation.

METS n'est cependant pas un outil. Une occurrence de METS est un document XML. Pour pouvoir utiliser METS comme conteneur dans l'entité Entrées, il faut un éditeur de texte, un éditeur XML ou, idéalement, une interface utilisateur à base de formulaires adaptée aux collections et à l'environnement de travail. Le traitement par lots exige une certaine programmation personnalisée pour intégrer les métadonnées dans la structure METS. L'utilisation de METS comme conteneur d'un paquet d'informations archivé requiert aussi un travail de programmation.
 

 

Exercice
 

1. Votre établissement a-t-il adopté une norme de métadonnées qui englobe la conservation d'objets numériques?

2. Examinez des normes en cours d'élaboration pour des conteneurs de métadonnées, par exemple METS, MPEG-21, FOXML et XFDU.