Qu’est-ce que l’Open Data?

Un mouvement en gestation depuis de nombreuses années

Littéralement, l’Open Data signifie l’ouverture des données.

La première impulsion en faveur de l’ouverture des données publiques date de la Révolution durant laquelle le principe du droit de la société de « demander compte à tout agent public de son administration » a été consacré dans la DDHC. Il a néanmoins fallu attendre 1978 pour que le droit à l’accès aux documents administratifs, soit intégré dans la loi française.

L’Union Européenne a ensuite encouragé l’initiative de la France en faveur de l’ « Open Data » dans une Directive invitant ses Etats membres à permettre la réutilisation des données détenues par des organismes du secteur public.

Cependant, si le principe de réutilisation libre et gratuite des données publiques s’impose à tous les Etats de l’Union, sa mise en œuvre se heurte à des difficultés, notamment dans le domaine de la santé où il convient de concilier intérêts publics et intérêts privés.

La mise en Open Data des données de santé : les lignes directrices 

Le Code de la Santé publique prévoit que le « droit fondamental à la protection de la santé doit être mis en œuvre par tous moyens disponibles » et que les organismes d’Assurance maladie doivent assurer « la meilleure sécurité sanitaire possible ». Il s’agit alors de trouver un équilibre entre le droit au respect de la vie privée des patients et le droit à l’information dans le cadre de la prévention des risques sanitaires.

Quels obstacles à l’ouverture des données de santé ?

Ce qui va réellement lancer les débats en matière d’ouverture des données de santé est le rapport sur « La gouvernance et l’utilisation des données de santé », déposé en octobre 2013 au Ministère des Affaires Sociales et de la Santé. Ce rapport signale un risque de ré-identificaion des données, pouvant conduire à de potentielles atteintes à la vie privée.

Un projet de modernisation du système de santé a donc été présenté par le ministre. Il contient de nombreuses mesures concernant l’encadrement de l’ouverture des données de santé et leurs conditions d’accès. L’article 47 de ce projet, adopté par l’Assemblée Nationale, conduit à la mise en Open Data des données de santé, notamment d’Assurance maladie.

Le Système National des Données de Santé (SNDS), sorte de « super base de donnée » gérée par la Caisse Nationale d’Assurance Maladie (CNAM), a également été créé pour mettre à disposition les données de la santé. Il rassemble les données issues de systèmes d’information des établissements de santé publics comme privés – notamment des hôpitaux – celles issues du système d’information de l’Assurance maladie, les données statistiques relatives aux causes de décès, les données « médico-sociales » issues des systèmes d’information des maisons départementales des personnes handicapées et un « échantillon représentatif des données de remboursement par bénéficiaire » transmis par les mutuelles.

Le 17 décembre 2015, l’intégralité du projet a été adoptée par le Parlement. On peut notamment faire ressortir de ce projet l’idée de création d’un site officiel, « transparence-santé.gouv.fr », qui recense depuis 2015 les liens d’intérêts entre les industriels du médicament et les professionnels de santé. Il semblerait qu’en rendant visibles ce genre d’informations, le législateur français veuille responsabiliser les professionnels de la santé. Cependant ces données seront-elles publiées en Open Data sur « data.gouv.fr » afin d’être réutilisables et susceptibles d’analyse ? Seul l’avenir le dira…

L’ouverture de certaines données soumise à condition : un “faux” Open Data protecteur de la vie privée des patients ?

Un autre important volet du projet porte sur la base centralisant les données individuelles de la CNAM, le Système National d’information interrégimes d’Assurance Maladie (SNIIRAM). On estime aujourd’hui qu’il détient 80% de l’ensemble des données de santé, certains parlent de véritable « terreau de l’open data santé française ». Leur extraction doit suivre un processus précis avant d’être validée par la Commission Nationale de l’Informatique et des Libertés (CNIL) en coordination avec l’Institut des Données de Santé. L’accès aux données qui y sont répertoriées s’avère en réalité difficile, en ce qu’il est conditionné pour certaines catégories de données. Le législateur offre sa protection aux patients en exigeant que les données centralisées dans le SNDS soient rendues anonymes, (suppression des mentions du nom, prénom, numéro de sécurité sociale, du patient ou tout autre élément d’immatriculation permettant de l’identifier), avant qu’elles ne soient mises à disposition gratuitement. Elles pourront dès lors être consultées dans un but non lucratif (ce qui exclut donc les assureurs et les laboratoires pharmaceutiques, par exemple).

Cependant il existe un deuxième niveau de données qui ne sont pas mises à disposition gratuitement en raison de leur caractère trop personnel pour être rendues anonymes. Selon la loi de 1978, constitue une donnée à caractère personnel « toute information relative à une personne physique identifiée ou qui peut être identifiée, directement ou indirectement, par référence à un numéro d’identification ou à un ou plusieurs éléments qui lui sont propres ». Ces dernières feront l’objet d’un accès contrôlé imposant à l’intéressé de prouver un motif d’intérêt public justifiant la nécessité d’y accéder. La diffusion illicite de telles données par une personne publique est sanctionnée de 5 ans d’emprisonnement et 300 000 euros d’amende.

L’état des lieux à la rentrée 2016 : un décalage entre l’esprit de la loi et la réalité

Il est donc possible de constater, malgré les efforts intentés par le législateur, que la mise en pratique de telles mesures s’avère techniquement plus complexe que la lettre de la loi.

Un tri entre les données publiques est en réalité réalisé entre celles qui sont réutilisables en elles-mêmes, celles devant faire l’objet d’un retraitement avant leur diffusion, et celles qui doivent rester confidentielles.

Si la première catégorie de données, dites « anonymisées », est en principe susceptible de mise à disposition en Open Data, le législateur ne mentionne pourtant pas le format dans lequel cela doit être réalisé. Il n’est donc pas garanti que les données soient effectivement diffusées dans un format ouvert.

De plus, s’il est dit dans les textes qu’elles seront mises en libre accès, il faut nuancer le propos par le fait qu’en réalité, une licence doit préalablement être accordée à l’acteur qui souhaite les réutiliser.

Encore, concernant le refus de communication à des acteurs à but lucratif, il a été possible de constater que la CNIL a cependant fait preuve de souplesse en autorisant à AXA et CEGEDIM à récupérer et anonymiser des prescriptions exécutées en pharmacie.

Le principe reste encore, dans la pratique, celui de la non communication des données de santé, et non du libre accès comme tentent de l’imposer les textes. Force est de constater que la mise à disposition des données ne se heurte pas seulement à des enjeux sociaux et juridiques, mais également à des enjeux numériques.

Article rédigé par Elodie Hoël, collaboratrice lesJuristes Paris.