Comment nous co-construisons le service public des données de référence avec ses utilisateurs

[:fr]La publication récente au Journal officiel de l’arrêté fixant les critères techniques et d’organisation de la mise à disposition des données de référence marque une étape importante pour la mise en oeuvre du service public des données de référence (SPD). Dorénavant, l’édifice juridique – loi, décret d’application, arrêté du Premier ministre – est complet. L’une des particularités de ce nouveau service public est d’être l’objet depuis son origine d’une co-construction avec ses utilisateurs et plus généralement avec l’ensemble des parties prenantes.

Consulter sur la mise en oeuvre, pas uniquement sur les grands principes 

Le SPD a donné lieu, comme l’ensemble des dispositions du projet de loi pour une République numérique d’une consultation en ligne inédite. A cette occasion, le principe même de ce nouveau service public avait été largement conforté. Certains regrettaient cependant que les conditions de mise en oeuvre (le périmètre des données concernées, l’organisation du service, les critères de qualité attendus) ne fassent pas l’objet du même processus de consultation. C’est dans cette optique que, dès la promulgation de la loi pour une République numérique en octobre 2016, la mission Etalab a lancé une consultation sur la mise en oeuvre du service public de la donnée. Cette consultation a permis d’alimenter la préparation des textes d’application. Elle a fait l’objet d’une synthèse et les 160 contributions individuelles ont été publiées sur data.gouv.fr après anonymisation.

Elargir le périmètre du service public de la donnée

Le premier enseignement de la consultation était la demande forte d’élargissement du périmètre du service public de la donnée. Dans sa version initiale, le texte prévoyait une liste de 6 bases de données de référence. Plusieurs répondants ont souligné que cette première liste constituait un « bon début », mais que de nombreuses autres bases de données mériteraient d’y figurer. Il a donc été décidé, en lien avec les producteurs concernés, de rajouter trois bases de données dès le lancement du dispositif. Parmi elles, on retrouve notamment le Référentiel de l’organisation administrative de l’Etat (la donnée la plus fréquemment citée par les répondants) mais aussi le Code officiel géographique (COG) qui permet d’avoir un ensemble cohérent et complet de données géographiques.

Piloter ce nouveau service public par les données

La consultation portait aussi sur l’organisation du service public de la donnée, et sur les rôles respectifs des producteurs et des diffuseurs des données de référence. Deux scénarii étaient proposés: dans le premier, dit scénario centralisé, un seul opérateur était en charge de la mise à disposition des données de référence, à l’instar du Data Distributor mis en place au Danemark (initiative Basic Data). Le second scénario, dit décentralisé, confiait au contraire cette responsabilité de diffusion aux seuls producteurs, le portail data.gouv.fr ne jouant alors que le rôle de référencement de ces données.

Cette question a divisé les répondants a parts égales, avec de chaque côté des arguments tranchés; pour certains seul un scénario centralisé était à même de garantir la cohérence et le niveau de service attendu du SPD, pour d’autres il était au contraire essentiel de responsabiliser les producteurs en leur confiant aussi la diffusion des données. Un consensus émergeait pourtant autour d’un principe: quel que soit l’organisation retenue, il était essentiel qu’une gouvernance et un pilotage fort soit mis en place, et que les données (liées à la qualité et la performance de la mise à disposition) y jouent un rôle.

Les textes consacrent ce principe: les producteurs peuvent diffuser eux-mêmes les données, ou designer un tiers à qui ils confient cette mission. Par exemple, l’IGN diffuse lui-même ses données, mais l’INSEE a confié la diffusion de la base SIRENE en téléchargement à la plateforme data.gouv.fr. Mais dans tous les cas, les critères de qualité de mise à disposition détaillés ci-après devront être respectés, faute de quoi l’administration en charge du portail interministériel des données publiques (la mission Etalab) pourra reprendre en main la diffusion. Le suivi des indicateurs de qualité et de performance sera prochainement rendu public, permettant à chacun de juger du respect des engagements pris.

Mise à jour, taux de disponibilité et performance: les engagements

La fraîcheur des données, l’utilisation de standards ouverts (1) et un haut niveau de disponibilité figuraient dans le trio de tête des attentes des réutilisations.  L’ensemble des producteurs concernés se sont engagés sur la périodicité de mise à jour des données de référence qui figurent dans l’arrêté du 14 juin 2017. Cette périodicité est par exemple quasi-quotidienne pour la base SIRENE (mise à jour le lendemain de chaque jour ouvré), hebdomadaire pour la Base adresse nationale et mensuelle pour le Répertoire national des associations.

L’arrêté fixe en outre les critères de performance de la mise à disposition attendus des diffuseurs: « l’administration chargée de la mise à disposition de données de référence garantit la disponibilité des données en téléchargement 99 % du temps mensuel, apprécié au terme de chaque mois. Elle s’efforce de garantir la disponibilité des données par l’intermédiaire d’une interface de programmation 99,5 % du temps mensuel, apprécié au terme de chaque mois. »

Parallèlement aux travaux juridiques, le service public des données de référence a commencé à voir le jour sur www.data.gouv.fr/reference – huit des neuf bases de données de référence sont aujourd’hui diffusées.

(1) L’utilisation de standards ouverts figure déjà parmi les nouvelles dispositions introduites par la loi pour une République numérique

 

 

 [:]