Le stockage des données ne correspond pas à la conservation numérique

African Studies Library

Il existe une perception erronée selon laquelle le simple fait de stocker et de sauvegarder des données de recherche est équivalent à la conservation garantie par la préservation numérique.

23 novembre 2017
Image d'un collecteur de fichiers. Image par Angelo Giordano de Pixabay

Il existe une perception erronée selon laquelle le simple fait de stocker et de sauvegarder des données de recherche équivaut à la conservation garantie par la préservation numérique. Grâce à une nouvelle prise de conscience de l'importance des données de recherche, une nouvelle "conscience des données" pour ainsi dire, il est maintenant largement reconnu qu'il est important de générer des sauvegardes régulières en plusieurs endroits (LOCKSS - Lots of Copies Keep Stuff Save). Mais le simple stockage des données, même avec de multiples sauvegardes, ne suffit pas à assurer la survie à long terme des objets numériques. Les matériaux numériques, qui représentent une proportion croissante de ce que les humains produisent comme connaissances et comme culture, sont très fragiles, peut-être même plus fragiles que les objets physiques.

En outre, la quantité de données de recherche que les institutions traitent quotidiennement (en particulier les données "born digital", c'est-à-dire les données générées numériquement) montre clairement que de simples méthodes de stockage et de sauvegarde ne suffisent pas à garantir un accès à long terme. Bien que la sauvegarde et l'enregistrement de copies multiples fassent partie du processus de préservation, la préservation numérique exige bien plus. La préservation à long terme est un processus qui garantit l'utilisabilité des données malgré les changements technologiques qui surviennent au fil du temps. Plusieurs aspects du processus de préservation numérique sont présentés ici :

  1. Processus de stockage

Les fichiers et supports numériques peuvent être endommagés. Par exemple, si un fichier est corrompu, il ne peut plus être ouvert. C'est là que les sauvegardes sont utiles, mais seulement si elles font partie d'un processus. Il est important de ne pas faire aveuglément confiance aux logiciels de sauvegarde, mais de vérifier régulièrement que les fichiers récupérés sont totalement identiques à ceux stockés à l'origine. Pour être sûr que les fichiers sont les mêmes et qu'ils ont tous été sauvegardés, il peut être utile de générer des sommes de contrôle pour les fichiers stockés.

  1. Formats de fichiers

La corruption des fichiers n'est pas la seule à mettre en danger les matériaux numériques. Le paysage technologique, y compris les formats de fichiers, évolue également au fil du temps. Aucune copie d'un fichier ne sera utile si le logiciel permettant de l'ouvrir n'existe plus. Pour une préservation à long terme, il faut tenir compte des modifications apportées aux logiciels et aux formats de fichiers et prendre des mesures pour prévoir les problèmes avant qu'ils ne surviennent. Par exemple, l'identification des formats de fichiers à risque et leur migration vers des formats plus largement supportés font partie d'un processus de préservation professionnel.

  1. Métadonnées

Les métadonnées sont importantes pour localiser les données et pouvoir les rechercher dans les catalogues et les bases de données. Cependant, les métadonnées sont également importantes pour donner un contexte au document, car sans de bonnes métadonnées, le sens de ce document peut être perdu. Si un ensemble de données est stocké, par exemple, sans information sur l'auteur de l'ensemble de données, sur la recherche qu'il soutient, etc., alors l'ensemble de données lui-même peut être incompréhensible et inutile. Ces informations doivent être fournies aussi près que possible de la création du fichier.

Il est impossible de prévoir quelles données de recherche ou quels matériaux issus de notre patrimoine culturel numérique seront utilisés à l'avenir. Cependant, s'ils sont correctement gérés et entretenus dès le départ, leur réutilisation est rendue possible et la valeur de cette réutilisation augmente.

Conclusion :

Le simple stockage, même avec de multiples sauvegardes, n'est pas comparable à la conservation à long terme, car :

  • Les fichiers ou les supports de stockage peuvent être endommagés, entraînant une perte de données.
  • Les données peuvent devenir inaccessibles à mesure que la technologie et les logiciels changent.
  • Les fichiers ont besoin de métadonnées pour pouvoir être découverts et recherchés.
  • Chaque type de fichier a besoin de métadonnées (thèmes, titres, auteurs, etc.) pour identifier son contexte.

Adapté de Natalie Harrower et Kathryn Cassidy au Digital Repository of Ireland.