L'ORD, en théorie
Les données de recherche
Les données de recherche correspondent à tous les enregistrements faits pendant les projets de recherche, et qui vont permettre de produire des connaissances (articles, livres...). Quelques exemples :
- Base de données numériques
- Entretiens audios, ou recodés par écrits
- Enregistrements visuels (photographies, films, documents numérisés)
- Carnets de notes
- Fichiers issus de logiciels
- Et bien d'autres formats...
Ces données sont expliquées, décrites et contextualisées par des métadonnées (des données sur les données), qui peuvent prendre des formes différentes (documentation, README, codebooks…).
Le cycle de vie des données
Plutôt qu’une durée de vie limitée, l’ORD propose d’offrir aux données un cycle de vie ininterrompu.
- Collecte : les données sont créées ou recueillies.
- Traitement : les données sont traitées pour rendre leur interprétation possible.
- Analyse : les données sont analysées pour produire des connaissances.
- Archivage: les données ont rempli leur première vocation ; elles sont maintenant documentées et archivées pour être préservées.
- Partage: c’est la nouvelle étape, qui permet de transformer une vie linéaire en un cycle de vie. Les données sont mises au service de la communauté pour être réutilisées, et commencent un nouveau cycle de vie aux mains de nouvelles personnes ; les producteurs originaux des données sont cités.
Les critères FAIR
Pour que les données puissent être réutilisées, elles doivent respecter un ensemble de critères, résumés par l’acronyme FAIR.
- Findable : les données doivent être trouvables. Cela implique qu’elles soient hébergées sur une plateforme reconnue, suffisamment bien décrites pour être identifiables, et disposent d’un identifiant unique et pérenne (DOI).
- Accessible : les données doivent être aussi accessibles que possible. Bien sûr, des exceptions existent (données sensibles, sous embargo…)
- Interoperable : les données doivent être encodées dans des formats utilisés par la communauté, et être décrites en suivant des vocabulaires contrôlés.
- Reusable : les données et le cadre de leur réutilisation doivent être décrits précisément.