RGPD et Open Data : incompatibles ?
Le Big Data est un marché en plein essor. Cependant, la valorisation des données publiques, encadrée par le principe d’open data en France, semble incompatible avec la protection des données personnelles du récent RGPD.
Big Data et santé
Selon un rapport BIS Research, le Big Data représentait 14,25 milliards de dollars en 2017 et pourrait atteindre 68,75 milliards de dollars en 2025. C’est le résultat d’une multiplication croissante des données en général, et des données de santé en particulier : 2312 exabytes – 2 312 milliards de gigabytes – d’ici 2020. En cause, l’augmentation des appareils connectés chez les particuliers (tensiomètre, balance et pilulier intelligents) et des applications de santé (dossier médical sur son smartphone, chatbot qui délivre des conseils médicaux) qui génèrent des flux massifs et continus de data. Ainsi, l’ouverture progressive des données de santé – ou Open Data – dans le monde alimentera bientôt ce marché du Big Data déjà colossal.
L’Open Data en France
Les grands volumes d’informations de santé détenues par l’État, par exemple les données de l’Assurance maladie sur l’efficacité des médicaments ou sur la consommation de produits de santé, sont extrêmement riches et dans le même temps très délicates à publier car elles touchent à la vie privée des patients. La loi du 26 janvier 2016 intègre la notion d’Open Data avec la création de l’INDS (Institut National des Données de Santé) pour en garantir les usages. Une fois rendues anonymes ou impossibles à la ré identification des personnes, partager les données des patients a pour but d’améliorer la performance des soins et des traitements médicaux.
Selon Denis Berthault, enseignant en Master 2 droit du numérique à Paris I, le nouveau Règlement Général sur la Protection des Données (RGPD) contraint les producteurs publics de données de santé à revoir tous leurs catalogues pour s’assurer qu’ils ne contiennent pas d’informations sensibles avant publication.
Malheureusement, les coûts d’anonymisation exorbitants peuvent contraindre ces organismes à réduire leur spectre des données diffusées pour la plupart gratuitement en ligne. Par ailleurs, anonymiser ces catalogues risque de les rendre inexploitables par manque de précision.
Open Data et RGPD, rendus compatibles ?
Pour réconcilier RGPD et Open Data en France, cet expert propose une solution : la théorie des cercles. Des cercles de producteurs de données qui recoupent des cercles de réutilisateurs avec des droits d’accès plus ou moins élargis à ces données. Certains exploitants habilités à traiter l’information la plus sensible devraient obtenir une licence particulière par le producteur, dans le cadre du RGPD.
Reste également à régler le problème du format des fichiers français. Aujourd’hui, ces fichiers sont délivrés dans un format unique et difficilement exploitable par les professionnels ou les écosystèmes du Big Data. Denis Berthault milite pour un nouveau standard plus international, afin d’améliorer la diffusion des données et donc des savoirs.
Sources :
https://www.lebigdata.fr/big-data-sante-2025-bis-research