Imprimer

Publications

Réutilisation des informations publiques : le GFII demande l’ouverture et la gratuité des données pivots

Document à télécharger : Réutilisation des informations publiques : le GFII demande l’ouverture et la gratuité des données pivots

Le GFII considère que les pouvoirs publics doivent saisir l’opportunité de la transposition de la directive européenne révisée concernant la réutilisation des informations du secteur public[1] pour créer un écosystème économique innovant, associant producteurs, diffuseurs et agrégateurs d’informations, laboratoires de recherche, professionnels de la dématérialisation, start-up et nouveaux acteurs de l’économie numérique.

 

Le GFII a formulé des propositions pour réunir les conditions optimales permettant le développement économique à partir de la réutilisation des informations publiques. Le présent document développe quatre propositions :

-          Organiser l’ouverture et la gratuité d’un plus grand nombre de  « données pivot »,

-          Elargir  le périmètre des données réutilisables,

-          Accompagner l’ouverture de certaines données,

-          Définir une véritable gouvernance des données et accompagner les administrations dans la publication.

 

En préambule, il convient de rappeler que la diffusion des informations sur un site web ne signifie pas ouverture. L’ouverture suppose la mise à disposition des données librement réutilisables, dans un format exploitable.

 

1. Organiser l’ouverture et la gratuité des « données pivot »

Le GFII souhaite que la transposition de la Directive révisée intègre une notion présente dans les débats européens, mais qui n’est pas reprise dans le texte de la Directive : la notion de « données pivot » ou « données de référence ».

Les « données pivot » ou  « données de référence » sont des données considérées comme identifiantes, par l’administration ou par l’usage,  pour nommer ou identifier des produits, des entités économiques, des territoires ou des acteurs (personnes physiques et morales). Ces  référentiels  sont indispensables pour lier des bases de données de nature hétérogène et construire tout nouveau service intégré au web des données (Linked Open Data). 

Un format ouvert spécifique à chaque type de donnée devrait obligatoirement être utilisé, tout en laissant la possibilité de publier également selon certains formats propriétaires très usités. Ces formats ouverts devraient être documentés et stables, toute modification de format devant être précédée de procédures de concertation éliminant tout imprévu pour les réutilisateurs.  Les formats de diffusion devraient s’appuyer, autant que possible, sur les normes internationales en vigueur dans les différents métiers, en particulier les normes ISO ou du W3C.

Ces données, de par leur importance, devraient être ouvertes et mises à disposition gratuitement. Les lots de données devraient être exhaustifs par rapport au domaine décrit. La pérennité et la périodicité  de la fourniture des données et de leurs éventuelles mises à jour devraient être garanties, ainsi que la traçabilité des traitements du producteur initial jusqu’à la diffusion.

Une réflexion doit également être menée au niveau international. De nombreux référentiels sont en effet réalisés par des organismes internationaux auxquels participe activement la France. L’ouverture et la diffusion gratuite de ces données pivot doit également être organisée et la France peut agir efficacement pour initier ce mouvement. Ces référentiels concernent de nombreux secteurs comme le domaine culturel (ISNI, ISSN, ISBN…) ou le domaine de la santé (nomenclature SNOMED CT couvrant tous les champs de la médecine humaine et vétérinaire). Cette initiative mettrait une nouvelle fois la France à la pointe de l’innovation dans le domaine de la diffusion des informations publiques.

Le GFII propose en annexe une première liste de ces données pivot qui devraient faire l’objet d’ouverture, par secteur.

 

 

2. Elargir  le périmètre des données  réutilisables                                                                                 

A l'exception de l’intégration limitée des données détenues par les établissements culturels, le périmètre de la réutilisation visé par la Directive n'a pas subi de modification sensible. A l’occasion de la transposition de la Directive révisée, un débat pourrait s’ouvrir en France sur les types d’informations qui, dans le cadre des missions de service public, sont utiles à la vie économique et citoyenne et doivent par conséquent entrer dans le champ de la réutilisation.

L’hétérogénéité des situations conduit à ce que certaines données locales soient ouvertes ici alors qu’elles  ne le sont pas ailleurs pour le même secteur. Cela s’observe en particulier pour les métiers de l’eau, des transports ou de l’énergie. Cette hétérogénéité constitue un obstacle à l’exploitation standardisée d’applications, est un facteur de coût et donc un poids nuisible pesant sur le développement de l’économie numérique et de l’emploi qui y est associé.

Le GFII propose en annexe une liste de ces données à ouvrir en priorité, par secteur. 


3. Accompagner l’ouverture

Certaines de ces données demandent des traitements spécifiques préalables à leur ouverture. De nombreux jeux de données restent aujourd’hui inaccessibles car les établissements publics ne bénéficient pas des budgets suffisants pour les mettre à disposition dans des formats lisibles par machine. Dans ces cas spécifiques, il serait souhaitable qu’un régime dérogatoire soit mis en place afin de permettre l’investissement qui rendra ces données accessibles (cf. Directive art. 6-2b). Le périmètre de l’investissement pris en compte pour l’établissement d’un tarif devrait se limiter strictement aux traitements spécifiques et au développement de plateformes allant au-delà d’une simple mise à disposition des données produites dans le cadre de la mission de service public. Le GFII suggère que les coûts pouvant être pris en compte pour définir l’assiette soient clairement définis : licence des logiciels utilisés spécifiquement pour l’anonymisation, l’exportation ou la conversion des données, adaptation de la base de données notamment pour l’exportation des données, améliorations/accroissement des capacités d’hébergement (hardware), infrastructures réseaux

En raison de la nature des investissements pris en compte, les régimes dérogatoires ne pourraient excéder une période de 5 ans.

4. Définir une véritable gouvernance des données et accompagner les administrations dans la publication

Le GFII a salué la nomination d’un administrateur général des données pour la France. Une vraie gouvernance des données devrait permettre :

-          De préciser les formats de mise à disposition des données les plus aptes à la réutilisation (enrichissement, croisement, mélange, interconnexion avec le web des données),

-          D’aider les administrations à mettre en place les modalités de publication de leurs données selon les formats recommandés,

-           De rationnaliser l’élaboration, l’usage et la maintenance des catalogues de métadonnées indispensables et permettant l’accès aux données de référence et aux données métiers,

-          De mettre en place des lieux de rencontres physiques et virtuels permettant les échanges public/privé sur les référentiels et les formats.

 



[1] Directive 2013/37/UE, du 26 juin 2013