Les efforts pour rendre les jeux de données accessibles  et réutilisables ont pour objectifs :

  • de mettre à disposition des équipes, clients, fournisseurs, citoyens… les jeux de données clés de l’organisation,
  • de faciliter la réutilisation des jeux de données par des applications, des algorithmes, de l’analyse statistique…

Les principes d’accessibilité et réutilisabilité s’appliquent aussi bien à des données ouvertes au grand public qu’à des données à accès restreint.

Les principes d’accessibilité et réutilisabilité sont bien détaillés dans les recommandations pour des “données FAIR” (Findable, Accessible, Interoperable, Reusable).

Accessibilité

description d'un jeu de données / dataset et catalogue de jeux de données
La fiche descriptive d’un jeu de données et un catalogue de jeux de données réutilisables

La facilité d’accès aux jeux de données repose sur la description standardisée de chaque jeux de données et la mise en place d’un catalogue des jeux de données accessible depuis l’intranet ou le web.

Réutilisabilité

jeux de données réutilisables et liés
Deux jeux de données réutilisables et liés

La facilité de réutilisation d’un jeu de données dépend de différents critères : 

  • la mise à disposition des utilisateurs du modèle d’organisation des données et d’une documentation du jeu de données,
  • la mise à disposition des données dans des formats interprétables et standardisées (json, csv, xml, rdf…),
  • un travail sur l’interopérabilité des données pour faciliter leur agrégation: 
    • quand une valeur dépend d’un vocabulaire contrôlé (référentiel), celui ci doit également être accessible et réutilisable,
    • quand une valeur fait référence à une ressource décrite dans un autre jeu de données  le lien doit être explicite et la ressource identifiée de manière unique.

Utilisation des standards
du web sémantique

L’application des standards du web sémantique facilite la mise en oeuvre des principes d’accessibilité, d’interopérabilité et de réutilisabilité des jeux de données grâce à l’identification des ressources par des URIs, la publication de vocabulaires contrôlés conformes au modèle SKOS et l’utilisation du modèle DCAT pour décrire les jeux de données.