L'open data en France : qualité du portail

Retour sur l’Open Data Maturity Index 2021 : Qualité du portail de données (3/4)

En 2021, la France a confirmé sa position de leader européen en matière d’open data, en atteste le classement de l’Open Data Maturity Report 2021 de la Commission européenne, qui a placé la France à la première place devant l’Irlande et l’Espagne.

L’Open Data Maturity Report 2021 évalue les progrès réalisés par les pays européens selon quatre critères :

  • maturité des politiques publiques relatives à l’ouverture (Policy) ;
  • qualité de la mesure de l’impact de l’open data (Impact) ;
  • maturité du portail national d’open data (Portal) ;
  • qualité des données ouvertes (Quality).

Ce rapport constate les résultats du travail accompli par Etalab et l’ensemble de la communauté open data et de mesurer le chemin qu’il reste à parcourir. Pour comprendre quels sont nos points forts et nos points faibles et identifier nos axes d’amélioration, nous proposons une série d’articles portant chacun sur une des dimensions évaluées par le rapport.

Il ne s’agit pas d’être exhaustif, mais de partager certains des aspects souvent salués en France et les axes d’améliorations les plus souvent évoqués.

Aujourd’hui nous nous concentrons sur la dimension Portal du rapport qui vise à mesurer la qualité du portail de données national, en l’occurrence data.gouv.fr.

Que cherche-t-on à mesurer ?

Cette dimension se concentre sur les fonctionnalités du portail qui permettent aux utilisateurs, qu’ils soient avertis ou non, d’accéder aux données ouvertes via le portail national, ainsi que sur les fonctionnalités qui améliorent l’interaction entre producteurs et réutilisateurs de données. En outre, cette dimension évalue dans quelle mesure les gestionnaires de portails utilisent des outils d’analyse web pour mieux comprendre les besoins et le comportement de leurs utilisateurs et mettent à jour les fonctionnalités des portails en fonction des résultats de ces analyses.

Les bonnes pratiques françaises

Les réutilisations de données sur data.gouv.fr

Contrairement à la plupart de ses homologues, data.gouv.fr permet à quiconque de publier une réutilisation sans contrôle à priori. Le référencement des réutilisations est un enjeu important pour data.gouv.fr pour plusieurs raisons. Tout d’abord, la connaissance des réutilisations est essentielle pour mesurer l’impact de l’ouverture des données. Les réutilisations sont également un vecteur d’information au public. Le référencement des réutilisations sur la plateforme nationale permet à un grand nombre d’utilisateurs de découvrir des réutilisations permettant de visualiser les données brutes sous des formes riches et diverses.

Une plateforme communautaire

Une autre caractéristique de data.gouv.fr est la possibilité de discuter l’ensemble des éléments du site. Cette fonctionnalité est essentielle pour échanger entre producteurs et réutilisateurs de données. Les commentaires servent notamment à favoriser la montée en qualité des données grâce aux retours des utilisateurs et faciliter la réutilisation des données.

Des statistiques d’usages accessibles

Les statistiques de fréquentations de data.gouv.fr sont accessibles à toutes et tous et permettent notamment de constater l’évolution des visites et les pages les plus consultées. A ceci s’ajoute aussi le catalogue des données de data.gouv.fr. Ce jeu de données contient les informations relatives à l’ensemble du catalogue de données de data.gouv.fr : notamment la liste des jeux de données, ressources, réutilisations et leurs informations associées (y compris certains indicateurs d’audience).

Un portail très populaire

La communauté open data Française est sûrement une des plus actives d’Europe et l’intérêt pour les données ouvertes est réel. La plateforme nationale surpasse de loin ses homologues en termes de visiteurs uniques y compris lorsque ce chiffre est rapporté à la population. Cet état de fait doit être nuancé par le positionnement un peu particulier de data.gouv.fr : une part très importante du trafic est orienté vers les réutilisations de données présentes sur la plateforme (voir notre article sur la dimension Impact).

Les axes d’améliorations

Fournir un suivi plus transparent et lisible de l’ouverture des données

Il est aujourd’hui complexe pour les usagers de connaître l’avancement de l’ouverture de tel ou tel jeux de données. Si les avis de la CADA sont ouverts et qu’il est possible de suivre l’ouverture des nouveaux jeux de données, codes sources et API publics, pour l’ensemble des ministères, inscrite dans leurs feuilles de route (voir l’article 1/4 sur la dimension Policy) cette transparence doit être élargit à d’autres jeux de données.

Le module de discussions entre producteurs et réutilisateurs peut être amélioré

Le système de commentaires de data.gouv.fr doit être amélioré pour favoriser les échanges entre producteurs et réutilisateurs. Il s’agit notamment de l’enrichir de fonctionnalités de votes, de mentions ou encore de modération pour améliorer l’expérience aussi bien des réutilisateurs que des producteurs de données.

Améliorer la prévisualisation des données

La plateforme nationale est aujourd’hui en grande partie fréquentée par des usagers ne disposant pas de compétences en exploitation de données. L’expérience pour ces usagers peut-être complexe dans la mesure est avant tout un portail de données brutes. Pour la faciliter, il est notamment important de développer la prévisualisation des données sur data.gouv.fr. La prévisualisation des données est également importante, car elle permet de les visualiser sans avoir à les télécharger et permet aux réutilisateurs de se faire une idée du contenu et de la qualité d’un jeu de données avant de l’exploiter. Une prévisualisation efficace des données permet également de pallier, dans une certaine mesure, le manque de documentation des données en permettant d’avoir accès à un aperçu des différents champs contenus dans le fichier.