Un projet des ACM lauréat du Programme “Open Research Data” de l’ETH Board
Open Research Data Portal
Le projet CA–O–RD (Contemporary Architecture – Open Research Data), soutenu par l’ETH Board et mené par les Archives de la construction moderne (EPFL), vise à mettre en place une infrastructure de préservation numérique pour les archives d’architecture, de plus en plus nativement numériques. En collaboration avec ENAC-IT4R, il s’appuie sur Archivematica, conforme au modèle OAIS, et intégré à Morphé (AtoM), pour assurer l’ingestion, la normalisation, la conservation et la diffusion des données.
Objectifs
Le projet vise à répondre au besoin des ACM de préserver durablement les archives numériques et d’en garantir l’accessibilité, dans une perspective d’Open Research Data.
Objectifs principaux :
- Assurer la conservation à long terme des archives nativement numériques et numérisées
- Offrir un accès ouvert aux contenus diffusables via Morphé (AtoM)
- Diffuser systématiquement les métadonnées, même sans accès aux fichiers
Périmètre :
- Environ 1 To de données (plus de 300 000 fichiers)
- Plusieurs fonds représentatifs sur supports variés
Données source
Le projet repose sur un corpus sélectionné d’archives numériques.
Caractéristiques du corpus :
- Environ 1 To de données (plus de 300 000 fichiers)
- Grande diversité de formats : CAO (.dwg, .dxf), images, PDF, fichiers bureautiques, formats compressés
- Supports variés : serveurs, disques externes, CD-R/DVD
Enjeux spécifiques :
- Complexité et hétérogénéité des fichiers
- Défis de préservation des formats CAO, souvent propriétaires et difficiles à migrer
Méthodologie
Le projet s’appuie sur une stratégie d’ingestion et de diffusion conciliant ouverture des données (ORD) et contraintes juridiques.
Critères de diffusion :
- Absence de données sensibles
- Attribution claire au producteur
- Pas de restrictions liées à des tiers
Workflow :
- Sélection et analyse des dossiers
- Préparation des métadonnées et de la structure
- Ingestion dans Archivematica
- Publication via AtoM (ou métadonnées seules)
Outils informatiques
Archivematica : Système de préservation numérique open source, fondé sur des normes internationales, notamment l’ISO 14721:2012 (OAIS), garantissant l’accès à long terme aux archives numériques.
Fonctionnement :
- Ingestion et validation des SIP (Submission Information Packages) soumis par les producteur·rices
- Génération des AIP (Archival Information Packages) via des processus de conversion, normalisation et enrichissement
- Création de DIP (Dissemination Information Packages) pour la diffusion via la plateforme Morphé(AtoM).
FAIR Data
Les ACM cherche à renforcer leur capacité de préservation et à garantir un accès aux données conforme aux principes FAIR (Findable, Accessible, Interoperable, Reusable) :
- Findable : chaque notice est dotée d’un identifiant stable et d’un lien pérenne
- Accessible : les descriptions sont en ligne, sans barrière d’accès
- Interoperable : les métadonnées suivent les normes archivistiques (ISAD(G) etc.) et peuvent être exportées ou croisées
- Reusable : les données sont sous licence ouverte, accompagnées de contexte et d’historique de traitement.
Données pour la recherche
Ces archives inédites ouvrent de nouvelles perspectives de recherche. Leur prise en charge nécessite des actions spécifiques pour garantir l’accès et l’authenticité des documents.
Principes :
- Conservation des trains de bits pour assurer l’intégrité et la réutilisation
- Migration vers des formats pérennes lorsque possible
- Extraction des métadonnées techniques et contextuelles
- Production de copies de diffusion dans des formats adaptés
