Synthèse de la consultation sur la mise en oeuvre du Service public de la donnée

Consultation sur la mise en oeuvre du Service public de la donnée: synthèse des contributions

La consultation s’est déroulée du 29 septembre au 20 octobre 2016. Nous avons reçu 160 contributions, vous pouvez les retrouver sur la plateforme data.gouv.fr. Nous remercions l’ensemble des participants à cette consultation et vous proposons une synthèse des principaux résultats.

https://datawrapper.dwcdn.net/glnmi/9/

Le secteur public représente 40% des répondants, avec une forte participation des collectivités (23% des répondants). Les répondants à titre individuel (particuliers) sont le second profil le mieux représenté, devant les entreprises (startups, PME, grands groupes) et le secteur associatif.

https://datawrapper.dwcdn.net/cxicQ/3/

Les 6 bases de données de référence* identifiées dans le cadre de l’étude d’impact de la loi pour une République numérique sont très largement validées par les participants. Près d’un répondant sur 4 indique que cette liste constitue « un bon début », soulignant que la liste initiale doit être complétée.

Registre des entreprises (base SIRENE),

Répertoire national des associations

Cadastre

Limites administratives du Référentiel à grande échelle

Registre parcellaire graphique

Base adresse nationale

https://datawrapper.dwcdn.net/OCc3m/4/

Invités à compléter la première liste des données de référence, les répondants ont cité une très grande diversité de bases de données. Ainsi, 57 bases ont été citées au moins une fois. Parmi les 15 données les plus fréquemment citées, un certain nombre sont déjà ouvertes. L’enjeu est donc leur mise à disposition de manière industrialisée, avec des engagements de qualité de mise à disposition forts (cf. infra).

https://datawrapper.dwcdn.net/UNHTY/3/

Les répondants n’ont pas clairement départagé les deux scénarios présentés. De plus, les avis sont assez tranchés sur cette question. Ainsi, certains répondants jugent que seule la création d’un opérateur unique de diffusion est de nature à répondre aux enjeux de disponibilité et d’harmonisation des données de référence. A l’inverse, les partisans d’un schéma décentralisé soulignent qu’il ne faut pas déresponsabiliser les producteurs de données de référence, et qu’ils doivent s’engager dans la diffusion.

Quel que soit le scénario de diffusion considéré, plusieurs répondants soulignent qu’une gouvernance forte du service public de la donnée est l’une des conditions de sa réussite.

https://datawrapper.dwcdn.net/TNntU/1/

Les données de référence doivent être diffusées en téléchargement et via une API. Les répondants soulignent que chaque mode de diffusion correspond à des usages et des types de données particuliers. Ainsi, pour alimenter des applications avec des données en temps réel, l’API est la mieux adaptée. A l’inverse, pour des usages de traitement statistique de données qui sont moins fréquemment mises à jour, le téléchargement est le mode le plus accessible.

https://datawrapper.dwcdn.net/ePoYz/4/

La fraîcheur des données est, de manière très  nette, la première qualité attendue des données de référence. Celle-ci peut se traduire d’au moins deux manières différentes: le délai entre un fait (par exemple l’enregistrement d’une nouvelle association) et son inscription dans la base de données; mais aussi la fréquence de mise à disposition du public de la base (la date à laquelle cette association apparaît effectivement dans le référentiel publié).

L’utilisation de standards ouverts, aisément réutilisables et lisibles par une machine, est le second critère cité. Il figure déjà dans la loi pour une République numérique. Les répondants attendent du service public de la donnée une haute de disponibilité (99%), en particulier pour les API.

On retrouve dans cette liste les dimensions habituelles de la qualité des données (exactitude, complétude, qualité de la documentation et des métadonnées)*. Mais les répondants citent aussi l’existence d’un dispositif de signalement et d’échange avec les producteurs comme l’un des éléments qui favorisent la qualité des données de référence. De même, la transparence sur les indicateurs de qualité, et la traçabilité sur le process de production des données sont cités comme des pré-requis pour les données de référence.

Prochaines étapes

Les résultats de cette consultation vont maintenant permettre de préparer le décret d’application de l’article 14 concernant la mise en oeuvre du service public de la donnée.

* Nous remercions l’association pour l’Excellence de la Qualité de l’Information pour sa contribution détaillée et les ressources qu’elle publie sur la qualité des données.

[:]