[:fr]OpenSolarMap : l’alliance du crowdsourcing et des data-sciences au service de la connaissance géographique[:]

[:fr]

Quel est le potentiel d’installation de panneaux solaires du parc immobilier français ? Quel est le pourcentage de toitures qui présentent une surface plate susceptible d’être végétalisée ?… : de nombreuses questions, liées à des enjeux économiques majeurs, bénéficieraient d’une connaissance précise du territoire français qui n’existe pas toujours. 

Le projet OpenSolarMap, visant notamment à calculer le potentiel énergétique des bâtiments et développé de façon itérative, est la preuve que cette information peut être enrichie avec des moyens modestes, en combinant astucieusement les leviers du crowdsourcing et des data-sciences.

opensolarmap

OpenStreetMap est un projet de cartographie collaborative amélioré chaque jour par des milliers de contributeurs bénévoles. La couverture du territoire français est déjà excellente pour les éléments géographiques et les infrastructures les plus importants, mais certaines informations sont encore très incomplètes. C’est par exemple le cas de la forme et de l’orientation des toitures des bâtiments.

Ces données, via l’évaluation du potentiel en énergie solaire, sont susceptibles d’intéresser toute la filière de l’énergie solaire. OpenSolarMap présente le moyen, entièrement constitué de code libre, de produire cette information.

Classer les toitures en quatre catégories

Afin d’identifier le bâti propice à l’installation de panneaux solaires, il s’est agi de classer les toitures dans l’une des quatre catégories suivantes:

  • toiture orientée au nord et au sud
  • toiture orientée à l’est et à l’ouest
  • toiture plate
  • toiture complexe ou difficile à classifier

Le point de départ a été l’analyse spatiale des emprises de bâtiments présents dans OpenStreetMap. Les toitures qui n’ont pas une orientation alignée avec les points cardinaux sont éliminées par un premier filtre utilisant les données du cadastre. En effet, le cadastre donne la position des murs extérieurs mais pas la position du faîte. Puis c’est l’image satellite du territoire gracieusement fournie par Mapbox qui permet d’attribuer un bâtiment dans une des quatre classes.

Figure 1 : exemples pour chaque classe

Une interface de crowdsourcing addictive

Une telle tâche se prête bien à la ludification. Christian Quest, d’OpenStreetMap France, imagine alors une interface de contribution simple d’utilisation et ouverte à tout le monde.

L’idée plaît au jury du concours Open PACA qui lui accorde le prix de la catégorie « Idée / Concept » en septembre 2015. Il concrétise l’idée lors du Climate Change Challenge en novembre 2015, avec l’aide d’un développeur rencontré lors de l’événement : opensolarmap.org.

Avec plus de 100.000 contributions recueillies en moins de 3 semaines, un système de vote permet de classer avec certitude plus de 10.000 bâtiments. Les contributions anonymisées sont librement accessibles sur la plateforme data.gouv.fr.

example_OpenSolarMap
Figure 2 : plateforme opensolarmap.org

Un réseau de neurones pour les 99% restants

Cet échantillon recueilli à partir des contributions crowdsourcées a alors permis d’entraîner un classifieur automatique : un programme informatique qui, une fois entraîné sur un nombre suffisant d’exemples, est capable de rendre des avis corrects sur de nouveaux cas.

Parmi les nombreux types de classifieurs adaptés aux images, Michel Blancard, Datascientist chez Etalab, a alors choisi d’utiliser un réseau de neurones. Les réseaux de neurones sont une méthode d’apprentissage automatique qui donne d’excellentes performances sur un large domaine de problèmes et plus particulièrement en traitement d’images. Il en existe de nombreuses implémentations libres, rapides à prendre en main et efficaces. Pour ces raisons, les réseaux de neurones constituent souvent une solution idéale, tant pour obtenir rapidement des résultats satisfaisants que pour élaborer soigneusement une solution repoussant l’état de l’art.

Au prix d’un modification mineure du réseau de neurones VGG16 (Université d’Oxford), les résultats obtenus sont corrects dans 80% des cas. Une estimation de la certitude des résultats permet d’ignorer au besoin les résultats trop incertains. Le code du réseau de neurone adapté est lui aussi libre, accessible sur github, ce qui permet à chacun de repartir de ce travail pour proposer une amélioration des résultats actuels.

convnet
Figure 3 : un réseau de neurones applique des transformations successives à une image (voir http://cs231n.github.io/convolutional-networks/)

Le temps de traitement pour une image de toit est d’environ une seconde pour un processeur. Pour traiter les 48 millions de toitures référencées par le cadastre, le temps de calcul est donc de 4 mois sur un ordinateur personnel disposant de 4 cœurs ou de 2 semaines sur un ordinateur puissant disposant de 32 cœurs. Nul besoin de disposer de matériel spécialisé pour profiter des dernières avancées en data-sciences ! De plus, avec une carte graphique il serait possible de réduire de beaucoup ce temps de calcul.

Ces résultats seront reversés sur le projet OpenStreetMap afin d’être librement accessibles à tous. Le code source de la plateforme de crowdsourcing et du classifieur automatique est hébergé sur la plateforme GitHub. Il est possible d’en savoir plus sur la partie datasciences du projet sur le blog de l’AGD.

Ces méthodes sont susceptibles d’être répliquées dans toute un variété de cas pour compléter la connaissance de l’information géographique, et d’améliorer ainsi certaines politiques publiques : classification à partir d’images des toitures pour des emplacements pour panneaux de solaires, pour jardins urbains, optimisation dans le domaine des transports en ville (zebra de bus…)

[:]