[:fr]L’ouverture du répertoire SIRENE par l’INSEE au 1er janvier 2017, une avancée majeure pour l’open data[:en]Opening the SIRENE repository on January 1, 2017: a major breakthrough for Open Data [:]

[:fr]

Le mardi 12 janvier, Axelle Lemaire a organisé à Bercy le #DataDay, une conférence débat sur la stratégie d’open data pour le développement de l’économie de la donnée, en présence de start-ups et grandes entreprises. Etaient notamment présents Data Publica et SNIPS, deux anciens lauréats du concours Dataconnexions. La Secrétaire d’État chargée du Numérique a saisi l’occasion pour annoncer l’ouverture gratuite, en open data, du répertoire SIRENE, géré par l’INSEE, à compter du 1er janvier 2017. L’ouverture de ce registre de référence devrait ouvrir des opportunités nouvelles pour le tissu économique, tant les possibilités de réutilisation et de croisement de ces données, sont importantes.

« Le répertoire SIRENE » : la plus grande base de données existante sur l’état-civil des entreprises

Le répertoire SIRENE rassemble des informations économiques et juridiques relatives à environ 10 millions d’entreprises et d’établissements, quel que soit leur secteur d’activité, situés en métropole ou dans les départements d’outre-mer. En moyenne, 10 000 modifications par jour sont enregistrées dans le répertoire. L’INSEE travaille avec de nombreux organismes, comme les greffiers des tribunaux de commerce, qui récoltent les informations sur les immatriculations, les radiations et les modifications au répertoire. Les données de la base SIRENE, parmi les plus complètes au monde, comprennent des données d’identification et des données économiques essentielles, notamment  :

  • L’adresse des établissements et leur statut juridique;
  • Le numéro SIRET/SIREN : Le numéro SIREN est le numéro d’identification unique attribué à chaque entreprise par l’INSEE, ce numéro sert à identifier la personne juridique de sa création à sa dissolution. Le numéro SIRET est attribué à chaque établissement, il est composé du numéro SIRET de l’entreprise et un numéro interne de classement (NIC). Avec ces deux codes, tous les établissements en France sont identifiés;
  • Le code APE : Toute entreprise et chacun de ses établissements possède un code caractérisant son activité principale par référence à la nomenclature d’activités française Ce code permet des statistiques très précises sur la répartition des secteurs en France;
  • La base de données des effectifs par tranche pour les entreprises et les établissements…;

Parce qu’elles sont susceptibles d’une utilisation fréquente par un grand nombre d’acteurs tant publics que privés et parce que leur qualité est essentielle pour ces utilisations, le répertoire SIRENE est susceptible de contribuer aux données de référence, au sens du projet de loi pour une République Numérique en discussion au Parlement.

Un impact économique majeur

Tous les acteurs, privés (entreprises, associations…) comme publics (administrations, collectivités territoriales…) pourront ainsi y accéder gratuitement. L’ouverture de ce répertoire enrichira la liste des données déjà mise en open data par l’INSEE, qui compte parmi les plus grands fournisseurs de données sur data.gouv.fr. Elle viendra compléter la mise à disposition des données relatives aux entreprises produites par la DILA (Boamp, Bodacc et Balo), l’INPI (marques, brevets et dessins), Infogreffe, ainsi que celles du Registre National du Commerce et des Sociétés (RNCS). 

L’impact économique attendu s’annonce majeur grâce aux externalités positives associées à cette ouverture : mise à disposition de données pivot, fiabilisation d’études et d’estimation de potentiels de marché, efficacité des politiques publiques…

En ouvrant ces données, la France honore ses engagements pris dans le cadre de la Charte Open Data du G8, et pourrait ainsi devancer – grâce à la qualité et à la complétude de la base – le groupe des pays les plus en pointe ayant déjà ouverts leurs registres des entreprises, dont le Royaume-Uni, l’Australie, l’Indonésie, la Norvège ou la Roumanie. Plus largement, de nombreux exemples démontrent les effets attendus [1] d’une plus grande ouverture des données publiques:

  • une progression très nette de la réutilisation des données, tant en nombre et diversité de réutilisateurs que de fréquence d’usage. En France, le passage à la gratuité du Référentiel à grande échelle de l’IGN pour les acteurs chargés d’une mission de service public s’est traduit par une multiplication par 20 de l’usage des données,
  • un rapport coûts / bénéfices très favorable, tant pour le secteur public que privé – de 1 à 13 pour les données géo spatiales australiennes, parmi les premières à être ouvertes dès 2006,
  • une dynamisation du marché aval des services fondés sur les données, avec l’apparition de nouveaux acteurs et une incitation plus forte à innover pour les acteurs historiques. Aux Etats-Unis, la décision du National Oceanic and Atmospheric Administration (NOOA) d’ouvrir leurs données a permis la création d’une industrie météorologique qui pèse aujourd’hui plusieurs milliards de dollars dans l’économie américaine [2],
  • une réduction des coûts de transaction et de l’asymétrie d’information dont les bénéfices concernent tout autant les acteurs publics que privés. Le Danemark a ainsi calculé que 70% des bénéfices de l’ouverture des données d’adresses revenaient au secteur privé et 30% au secteur public, pour un retour sur investissement de 14 millions € de bénéfices contre un coût de 0,2 million € en 2010 [3],
  • une lutte accrue contre la corruption et la fraude fiscale par la réduction des asymétries d’information. Au Canada en 2010, une fraude fiscale de 3,1 milliards de dollars a pu être identifiée grâce aux données ouvertes [4]. En Ukraine, une fraude d’un 1.8 milliards de dollars a également été détectée [5].

[1] Voir « Open Data for Economic Growth » (World Bank, 2014) et « The Generative Mechanisms of Open Government Data » (Jetzek Thorhildur, 2013), « Cost and benefits of data provision » (Victoria University, 2011).

[2] http://www.nytimes.com/2008/07/07/business/media/07weather.html?_r=0

[3] http://www.adresse-info.dk/Portals/2/Benefit/Value_Assessment_Danish_Address_Data_UK_2010-07-07b.pdf

[4] http://eaves.ca/2010/04/14/case-study-open-data-and-the-public-purse/

[5] http://rue89.nouvelobs.com/2015/11/02/demandez-a-quoi-sert-lopen-data-allez-voir-ukraine-261916

[:en]

On January 12, 2016 Axelle Lemaire organized the #DataDay, a conference-debate on openness strategies in data economics, with big corporations and startups alike. Among them were Data Publica and SNIPS, two previous winners of the Dataconnexions contest. The Minister of State for Digital Affairs seized the opportunity to announce the free opening, in open data of the SIRENE repository managed by the national statistics institute INSEE, on January 1, 2017. The many possibilities of reuses and cross analysis offered by opening up this repository will create new economic opportunities.

.

« Sirene Repository » The biggest database on company civil status

The SIRENE company register gathers economical and legal information on close to 10 million businesses and branches across all sectors of activity in metropolitan France and overseas departments. On average, 10,000 updates are submitted every day. The INSEE works with a lot of actors, like commercial courts clerks, gathering information on matriculations, radiations and changes made to the repository. This makes SIRENE among the world’s most complete databases, it contains essential economical information and identification, including:

  • The address of facilities and their legal status;
  • The SIRET/SIREN ID Number: The SIREN number is a unique ID number assigned to each business by the INSEE. This number identifies a legal person from its creation until its termination. The SIRET number is assigned to each branch. It comprises the SIREN number and an internal ranking number (NIC). With those two codes, all the facilities in France are identified;
  • The APE code: Every operating business has a code characterizing its major activity in reference to the classification of economic activities. This code allows precise statistics on activity sectors in France;
  • The database for the size of the workforce by segment for businesses and facilities…

SIREN ought to be amongst the « données de reference » (key databases used as a reference) defined in the Digital Republic Bill, currently discussed in the French parliament, as it is likely to be widely and frequently used by a great number of actors and its quality is essential for reuses.

A major economic impact

By opening this register, France honors its commitments in the G8 Open Data Charter and could join the leading countries that already opened their company registers like Norway, the UK, Australia, Indonesia or Romania.

All actors, public (administrations, territorial authorities…) and private (companies, non-profits…) will access the data free of charge. Opening the repository will enrich the list of databases already published in open data by the INSEE, one of data.gouv.fr’s largest data provider. It will complement company data released by the DILA (Boamp, Bodacc and Balo), the INPI (brands, patents, and drawings), Infogreffe and the National Register of Commerce and Companies (RNCS).

The awaited economic impact is massive, given the positive externalities associated with this opening: availability of key data, increasing reliability of studies and market researches, efficiency of public policies etc. Furthermore, a lot of examples demonstrate the awaited effects [1]of Open Data:

  • a clear increase in reuses in terms of volume, diversity and frequency. In France, the switch to gratuity of public service repertories for government entities from the national geographic institute (IGN) saw 20 times more reuses,
  • a very advantageous cost/benefit ratio both for the public and private sector – 1 to 13 for Australian geospatial data-,
  • a revitalization of the data-based service industry, with new actors and a bigger innovation incentive for historic actors. In the US, the National Oceanic and Atmospheric Administration’s decision to open its data allowed the creation a multibillion meteorological industry.[2],
  • a transaction cost reduction and information asymmetry reduction whose benefits could concern private and public actors. Denmark calculated that 70% of the benefits of open data would benefit private sector and 30% public sector, with a return on investment of €14 million in benefits for only €0,2 million in costs, in 2010[3],
  • a strengthened effort against corruption and tax evasion thanks to information asymmetry reduction. In Canada in 2010, a tax evasion of $3,1 billion was identified thanks to open data. [4]. In Ukraine, a $1,8 billion fraud was detected [5].

[1] See « Open Data for Economic Growth » (World Bank, 2014) et « The Generative Mechanisms of Open Government Data » (Jetzek Thorhildur, 2013), « Cost and benefits of data provision » (Victoria University, 2011).

[2] http://www.nytimes.com/2008/07/07/business/media/07weather.html?_r=0

[3] http://www.adresse-info.dk/Portals/2/Benefit/Value_Assessment_Danish_Address_Data_UK_2010-07-07b.pdf

[4] http://eaves.ca/2010/04/14/case-study-open-data-and-the-public-purse/

[5] http://rue89.nouvelobs.com/2015/11/02/demandez-a-quoi-sert-lopen-data-allez-voir-ukraine-261916[:]