L'open data made in France, plébiscitée par l'Europe

L'open data made in France, plébiscitée par l'Europe
⏱ Lecture 5 min

Par Gérard Haas et Marussia Samot 

Les français ont de plus en plus l’usage de l’Open Data au quotidien. Parallèlement, ces données leur sont rendues davantage accessibles et exploitables.

Ce 27 avril 2021, le Premier ministre Jean Castex a diffusé une circulaire relative à « la politique publique de la donnée, des algorithmes et des codes sources » à destination des ministères et des préfets de région, affirmant la stratégie gouvernementale française d’accélérer le mouvement de l’Open Data des données publiques, dans un pays déjà leader en la matière.

1. Les usages de l’Open Data

Open data, littéralement « données ouvertes », est un terme désignant aussi bien des données numériques qui ont vocation à être rendues publiques, c’est-à-dire librement accessibles et utilisables par tous, qu’une politique de gestion des données par les autorités publiques consistant à les diffuser publiquement et gratuitement.

Ce format de données ouvertes au grand public nourrit un dessein de transparence pour les administrés. Il est observé un besoin grandissant chez ces derniers : celui de pouvoir consulter librement des données publiques d’acteurs publics ou privés et de pouvoir les réutiliser librement dans un format structuré.

La plateforme data.gouv.fr est aujourd’hui la première plateforme de diffusion des données publiques de l’Etat français.

Les français ont de plus en plus l’usage de l’Open Data au quotidien. Parallèlement, ces données leur sont rendues davantage accessibles et exploitables. Aujourd’hui, réserver sa place en bibliothèque, trouver une place de stationnement libre ou connaître l’heure d’arrivée de son bus en temps réel n’a jamais été aussi simple.

Plus récemment, le site CovidTracker, chiffrant l’évolution de la pandémie de la Covid19 en France et dans le monde s’est implanté dans nos vies. Avec sa plateforme jumelle « Vite ma dose » recensant les créneaux de vaccination les plus proches, ces deux sites reposent sur l’ouverture de données publiques, mises à disposition par l’INSEE, la DREES ou encore Santé publique France, et sont utilisés par 5 à 10 millions d’utilisateurs par mois.

Les entreprises exploitent elles aussi davantage l’Open Data. Le partage de la donnée leur permet de récupérer des jeux de données publiques de qualité provenant de divers secteurs d’activité, ainsi que des données essentielles faciles d’accès, telles que celles du répertoire Sirene de l’Insee recensant de manière actualisée l’état civil des entreprises et établissements administratifs français.

Déployer leurs propres données publiques aux yeux de tous permet également aux acteurs privés de valoriser leur expertise, de conforter une relation de confiance avec leurs clients et d’affirmer des valeurs de responsabilité sociale et environnementale.

Par ailleurs, l’Open Data est un outil d’amélioration de l’action publique. A titre d’illustration, de nouveaux services usant de données publiques peuvent être mis en place contre la défaillance d’entreprise en prévenant entre autres les retards de paiement de charge. De même, la mutualisation des données des parcs et jardins avec celles de localisation des essences d’arbres, permet de faciliter la réalisation de travaux de désimperméabilisation et de végétalisation dans les cours d’écoles.

2. L’Open Data, une force nationale

La mission Etalab, un département de la Direction interministérielle du numérique (DINUM), porte depuis dix ans l’action de l’Etat en matière d’ouverture et de partage des données publiques. Ses prérogatives ont été renforcées avec la Loi pour une République numérique de 2016.

Etalab a partagé sur son site web divers classements économiques internationaux en date de 2020, démontrant la position dominante de la France en matière d’Open Data.

Ainsi, l’OURdata Index (Open, Useful and Re-usable data Index) de l’OCDE, évaluant l’efficacité des politiques d’ouverture des données gouvernementales, place la France en deuxième position du classement mondial derrière la Corée du Sud. Ces deux pays mènent le classement depuis 2017.

Sur la base du DESI (Digital Economy and Society Index), mesurant la « compétitivité numérique » des pays de l’Union européenne, l’Open Data Maturity Report de la Commission européenne, évaluant l’évolution de la mise en œuvre de la politique des Etats membres en matière d’ouverture et d’utilisation des données publiques, a, quant à lui, placé la France en troisième position derrière l’Irlande et l’Espagne avec un score qualitatif de 89%.

La valeur de l’Open Data en France aurait été chiffrée à hauteur de 28 milliards d’euros en 2019.

La raison est simple : depuis la loi pour une République numérique l’Open Data est devenue la règle pour les administrations.

Les collectivités territoriales doivent désormais publier leurs principales bases de données administratives, leurs codes sources et algorithmes publics dans un format ouvert, de même que toutes données représentant un intérêt économique, social, sanitaire ou environnemental, dans le respect de la protection des données à caractère personnel et des secrets protégés par la loi.

Les deux classements plébiscitent également la France pour la qualité de son portail centralisé data.gouv.fr. Ils le considèrent comme l’un des plus développés et saluent son caractère collaboratif.

3. Le renforcement de l’action publique en plusieurs points

A) L’exploitation de données publiques par l’intelligence artificielle

L’utilisation de l’Open Data et de l’intelligence artificielle (IA) peuvent aller de pair, ce dont prennent conscience les administrations.

La plupart des systèmes d’IA actuels fonctionnent grâce au machine learning (apprentissage automatique) et engrangent d’énormes quantités de données afin d’apprendre en continu. Or, sans données disponibles, l’IA ne peut pas fonctionner. L’Open Data permet alors d’assembler un grand amas de données en libre-service et de les traiter de manière automatisée sans que cela ne nécessite de programmation explicite.

La ville de Nantes a ainsi eu recours à un outil utilisant IA et données publiques pour optimiser la gestion des cantines scolaires. Les parents ayant jusqu’à 10 heures du matin pour décider de laisser leur enfant ou non à l’école, le nombre de repas livrés peut parfois dépasser le nombre d’enfants mangeant sur place. L’IA se base sur une grande quantité de données telles que la météo, la constitution du menu et les jours de grève pour les analyser au regard d’un historique de neuf ans et prévoir la réaction qu’auront les parents. Après quatre mois d’expérimentation, la métropole nantaise rapporte avoir fait baisser drastiquement le nombre de repas non consommés et son outil est désormais mis à libre disposition des autres collectivités, une véritable aubaine !

B) Une nouvelle stratégie pour une meilleure circulation de la donnée

Une circulaire du 27 avril 2021 révèle la volonté du Gouvernement français de prendre de nouveaux engagements en matière d’Open Data des décisions administratives, dans le contexte d’une société en continuelle transformation numérique.

En effet, l’ouverture et l’utilisation des données publiques est aujourd’hui un enjeu majeur, indispensable à l’efficacité de l’action publique en temps de crise.

Les administrations publiques doivent, d’après le Premier ministre, rechercher en permanence la « meilleure circulation » des documents administratifs, soit renforcer l’utilisation des codes source et algorithmes publics et favoriser le recours à des logiciels libres et ouverts.

Cette circulation ne peut se faire que sous réserve de confiance et de limitation des risques de réidentification afin d’éviter toute réutilisation préjudiciable des informations publiées : les données doivent donc faire l’objet d’une anonymisation (elles ne pourront plus être reliées à un individu déterminé ou déterminable), d’une pseudonymisation (l’identifiant initial de l’individu concerné sera remplacé par un pseudonyme, mais il sera toujours possible de remonter jusqu’à lui) ou d’une agrégation (méthode consistant à rassembler des données du même type afin de produire des données agrégées rendant impossible l’identification individuelle). Elles devront aussi bénéficier d’un accès sécurisé.

Des administrateurs ministériels des données seront nommés dans chaque ministère d’ici le 15 mai 2021 et auront pour tâche d’élaborer la stratégie dudit ministère en matière d’Open Data.

Des référents « données, algorithmes et codes sources » seront également nommés auprès de chaque préfet de région afin d’assurer une liaison.

Une mission « dédiée à la promotion interministérielle en matière de logiciel libre et de communs numériques » sera prochainement mise en place au sein de la DINUM. Elle devra notamment œuvrer à l’ouverture et la circulation des algorithmes et des codes source produits par les administrations et créer un site web (« code.gouv.fr ») dédié à la publication de ces mêmes codes sources. Elle aura pour autre mission d’épauler l’ANSSI pour tout enjeu relatif à la cybersécurité.

***

Le cabinet HAAS Avocats est spécialisé depuis plus de 20 ans dans la protection des données personnelles et se tient à vos côtés pour vous accompagner dans la conformité de vos traitements de donnéesPour en savoir plus, contactez-nous ici.

Gérard HAAS

Auteur Gérard HAAS

Suivez-nous sur Linkedin