Répertoire SIRENE de l’INSEE : les données sur 10 millions d’établissements maintenant disponibles en open data[:en]Opening of the French company register ‘SIRENE’ (+10 million businesses and branches)

[:fr]

Conformément aux dispositions de la loi pour une République numérique, l’Institut national de la statistique et des études économiques a publié ce jour la base SIRENE en open data sur le portail data.gouv.fr. Cette ouverture représente une avancée majeure en matière d’ouverture des données publiques. Cette base, qui comprend près de 9 millions d’entreprises et 10 millions d’établissements, a vocation à intégrer prochainement le service public de la donnée. Vous pouvez maintenant télécharger l’intégralité de la base, les mises à jour quotidiennes, ainsi que la documentation associée.

« Le répertoire SIRENE » : la plus grande base de données existante sur l’état-civil des entreprises

Le répertoire SIRENE rassemble des informations économiques et juridiques relatives à environ 10 millions d’entreprises et d’établissements, quel que soit leur secteur d’activité, situés en métropole ou dans les départements d’outre-mer. En moyenne, 10 000 modifications par jour sont enregistrées dans le répertoire. L’INSEE travaille avec de nombreux organismes, comme les greffiers des tribunaux de commerce, qui récoltent les informations sur les immatriculations, les radiations et les modifications au répertoire. Les données de la base SIRENE, parmi les plus complètes au monde, comprennent des données d’identification et des données économiques essentielles, notamment  :

  • L’adresse des établissements et leur statut juridique;
  • Le numéro SIRET/SIREN : Le numéro SIREN est le numéro d’identification unique attribué à chaque entreprise par l’INSEE, ce numéro sert à identifier la personne juridique de sa création à sa dissolution. Le numéro SIRET est attribué à chaque établissement, il est composé du numéro SIRET de l’entreprise et un numéro interne de classement (NIC). Avec ces deux codes, tous les établissements en France sont identifiés;
  • Le code APE : Toute entreprise et chacun de ses établissements possède un code caractérisant son activité principale par référence à la nomenclature d’activités française Ce code permet des statistiques très précises sur la répartition des secteurs en France;
  • La base de données des effectifs par tranche pour les entreprises et les établissements…

 

Un impact économique majeur

Tous les acteurs, privés (entreprises, associations…) comme publics (administrations, collectivités territoriales…) peuvent ainsi accéder gratuitement à ces données. L’ouverture de ce répertoire enrichit la liste des données déjà mises en open data par l’INSEE, qui compte parmi les plus grands fournisseurs de données sur data.gouv.fr, ainsi que d’autres sources de données relatives aux entreprises (Boamp, Bodacc et Balo), données INPI (marques, brevets et dessins), données Infogreffe…).

Mi-novembre 2016, le Hackathon #OpenSirene organisé avec l’INSEE avait permis de préparer cette ouverture et d’identifier de premiers exemples de réutilisations des données.

L’impact économique attendu s’annonce majeur grâce aux externalités positives associées à cette ouverture : mise à disposition de données pivot, fiabilisation d’études et d’estimation de potentiels de marché, efficacité des politiques publiques…

En ouvrant ces données, la France honore ses engagements pris dans le cadre de la Charte Open Data du G8, et pourrait ainsi devancer – grâce à la qualité et à la complétude de la base – le groupe des pays les plus en pointe ayant déjà ouverts leurs registres des entreprises, dont le Royaume-Uni, l’Australie, l’Indonésie, la Norvège ou la Roumanie. Plus largement, de nombreux exemples démontrent les effets attendus [1] d’une plus grande ouverture des données publiques:

  • une progression très nette de la réutilisation des données, tant en nombre et diversité de réutilisateurs que de fréquence d’usage. En France, le passage à la gratuité du Référentiel à grande échelle de l’IGN pour les acteurs chargés d’une mission de service public s’est traduit par une multiplication par 20 de l’usage des données,
  • un rapport coûts / bénéfices très favorable, tant pour le secteur public que privé – de 1 à 13 pour les données géo spatiales australiennes, parmi les premières à être ouvertes dès 2006,
  • une dynamisation du marché aval des services fondés sur les données, avec l’apparition de nouveaux acteurs et une incitation plus forte à innover pour les acteurs historiques. Aux Etats-Unis, la décision du National Oceanic and Atmospheric Administration (NOOA) d’ouvrir leurs données a permis la création d’une industrie météorologique qui pèse aujourd’hui plusieurs milliards de dollars dans l’économie américaine [2],
  • une réduction des coûts de transaction et de l’asymétrie d’information dont les bénéfices concernent tout autant les acteurs publics que privés. Le Danemark a ainsi calculé que 70% des bénéfices de l’ouverture des données d’adresses revenaient au secteur privé et 30% au secteur public, pour un retour sur investissement de 14 millions € de bénéfices contre un coût de 0,2 million € en 2010 [3],
  • une lutte accrue contre la corruption et la fraude fiscale par la réduction des asymétries d’information. Au Canada en 2010, une fraude fiscale de 3,1 milliards de dollars a pu être identifiée grâce aux données ouvertes [4]. En Ukraine, une fraude d’un 1.8 milliards de dollars a également été détectée [5].
[1] Voir « Open Data for Economic Growth » (World Bank, 2014) et « The Generative Mechanisms of Open Government Data » (Jetzek Thorhildur, 2013), « Cost and benefits of data provision » (Victoria University, 2011).

[2] http://www.nytimes.com/2008/07/07/business/media/07weather.html?_r=0

[3] http://www.adresse-info.dk/Portals/2/Benefit/Value_Assessment_Danish_Address_Data_UK_2010-07-07b.pdf

[4] http://eaves.ca/2010/04/14/case-study-open-data-and-the-public-purse/

[5] http://rue89.nouvelobs.com/2015/11/02/demandez-a-quoi-sert-lopen-data-allez-voir-ukraine-261916

 [:en]

« Sirene Repository » The biggest database on company civil status

The SIRENE company register gathers economical and legal information on close to 10 million businesses and branches across all sectors of activity in metropolitan France and overseas departments is now available on our open data platform: data.gouv.fr. On average, 10,000 updates are submitted every day. The INSEE works with a lot of actors, like commercial courts clerks, gathering information on matriculations, radiations and changes made to the repository. This makes SIRENE among the world’s most complete databases, it contains essential economical information and identification, including:

  • The address of facilities and their legal status;
  • The SIRET/SIREN ID Number: The SIREN number is a unique ID number assigned to each business by the INSEE. This number identifies a legal person from its creation until its termination. The SIRET number is assigned to each branch. It comprises the SIREN number and an internal ranking number (NIC). With those two codes, all the facilities in France are identified;
  • The APE code: Every operating business has a code characterizing its major activity in reference to the classification of economic activities. This code allows precise statistics on activity sectors in France;
  • The database for the size of the workforce by segment for businesses and facilities…

SIREN is one of the « données de reference » (key databases used as a reference) defined in the Digital Republic Bill as it is likely to be widely and frequently used by a great number of actors and its quality is essential for reuses.

A major economic impact

By opening this register, France honors its commitments in the G8 Open Data Charter and could join the leading countries that already opened their company registers like Norway, the UK, Australia, Indonesia or Romania.

All actors, public (administrations, territorial authorities…) and private (companies, non-profits…) will access the data free of charge. Opening the repository will enrich the list of databases already published in open data by the INSEE, one of data.gouv.fr’s largest data provider. It will complement company data released by the DILA (Boamp, Bodacc and Balo), the INPI (brands, patents, and drawings), Infogreffe and the National Register of Commerce and Companies (RNCS).

The awaited economic impact is massive, given the positive externalities associated with this opening: availability of key data, increasing reliability of studies and market researches, efficiency of public policies etc. Furthermore, a lot of examples demonstrate the awaited effects [1]of Open Data:

  • clear increase in reuses in terms of volume, diversity and frequency. In France, the switch to gratuity of public service repertories for government entities from the national geographic institute (IGN) saw 20 times more reuses,
  • a very advantageous cost/benefit ratio both for the public and private sector – 1 to 13 for Australian geospatial data-,
  • revitalization of the data-based service industry, with new actors and a bigger innovation incentive for historic actors. In the US, the National Oceanic and Atmospheric Administration’s decision to open its data allowed the creation a multibillion meteorological industry.[2],
  • transaction cost reduction and information asymmetry reduction whose benefits could concern private and public actors. Denmark calculated that 70% of the benefits of open data would benefit private sector and 30% public sector, with a return on investment of €14 million in benefits for only €0,2 million in costs, in 2010[3],
  • strengthened effort against corruption and tax evasion thanks to information asymmetry reduction. In Canada in 2010, a tax evasion of $3,1 billion was identified thanks to open data. [4]. In Ukraine, a $1,8 billion fraud was detected [5].

[1] See « Open Data for Economic Growth » (World Bank, 2014) et « The Generative Mechanisms of Open Government Data » (Jetzek Thorhildur, 2013), « Cost and benefits of data provision » (Victoria University, 2011).

[2] http://www.nytimes.com/2008/07/07/business/media/07weather.html?_r=0

[3] http://www.adresse-info.dk/Portals/2/Benefit/Value_Assessment_Danish_Address_Data_UK_2010-07-07b.pdf

[4] http://eaves.ca/2010/04/14/case-study-open-data-and-the-public-purse/

[5] http://rue89.nouvelobs.com/2015/11/02/demandez-a-quoi-sert-lopen-data-allez-voir-ukraine-261916[:]