La bataille des données de santé

Non : que ce soit pour la recherche ou pour mesurer la « qualité » des soins, les statistiques ne font ni ne disent tout. Mais loin que cela freine les ardeurs, tout laisse supposer que le pouvoir des chiffres ne va cesser de croître. Poussé par des intérêts bien compris. Survol d’un champ de bataille.

Avril 2017 : le Système national des données de santé (SNDS) se mettait en place. Qu’est-ce ? Un système créé par la loi de modernisation du système de santé (article 193) de janvier 2016, géré par la CNAMTS, et rassemblant(1) : les données de l’assurance maladie (base SNIIRAM), les données des hôpitaux (base PMSI), les causes médicales de décès (base du CepiDC de l’INSERM), les données relatives au handicap (en provenance des MDPH – données de la CNSA)… et à compter de 2019, un échantillon de données en provenance des organismes complémentaires.
La même loi prévoit l’ouverture en « open data » des données de santé agrégées – et un accès beaucoup plus limité aux données personnelles, lesquelles seront d’ailleurs soigneusement « pseudonymisées ».
Parallèlement, d’autres dispositions fixent les conditions pour que les professionnels de santé – on parle désormais d’« équipe de soins » (article L1110-12 du code de santé publique) puissent accéder aux données de santé des patients, et les échanger. Avec bien sûr de strictes obligations de secret professionnel(2).
L’intérêt ? D’une part, favoriser la recherche en santé puisque, comme le relève la DREES, « Toute personne ou structure, publique ou privée, à but lucratif ou non lucratif, pourra dès avril 2017 accéder aux données du SNDS sur autorisation de la CNIL, en vue de réaliser une étude, une recherche ou une évaluation présentant un intérêt public. »(3) Et d’autre part, « développer de nouvelles pratiques professionnelles, notamment grâce à la mobilité, pour améliorer la qualité de la prise en charge ou la coordination des différentes interventions au profit d’un même patient. »(4)
Tout va donc pour le mieux dans le meilleur des mondes. Sauf que, justement, le point n’est peut-être pas si loin où l’on passe de Leibniz à Huxley.

Le data boom

Premièrement, car la quantité même de ces données – pour l’instant, on ne parle que des données relatives au patient – explose déjà et est en passe d’exploser encore davantage. Avec les dossiers médicaux et les obligations de traçabilité, le professionnel de santé devient un pourvoyeur de données – un travail dont il ne s’acquitte souvent qu’à son corps défendant, ce qui ne va pas sans soulever des questions quant à la qualité des « data » collectées (lire encadré p. 34). Souvent, mais pas toujours, car les progrès thérapeutiques supposent eux-mêmes de la part du praticien la collecte d’un nombre croissant d’informations.
Un exemple : le récent développement des thérapies ciblées, pour l’efficacité desquelles un essai clinique français vient d’apporter de nouvelles « preuves »(5). Pour cette étude MOSCATO, les chercheurs de l’Institut Gustave Roussy ont obtenu une biopsie de la tumeur pour 948 patients et ont pu établir la carte génétique de la tumeur pour 843 patients – soit des tera-octets d’informations. Comme aime à le rappeler Laurent Alexandre, remuant chirurgien créateur de Doctissimo et aujourd’hui dirigeant de DNAvision – une société de séquençage d’ADN – une tumeur contient 2000 milliards d’informations. Auditionné au Sénat il y a un an, il soulignait l’inévitable impact de la « médecine personnalisée » sur le volume des données médicales : « le séquençage ADN, c’est (…) 20 000 milliards d’information par malade, chacun ayant 2 millions de mutations face au génome de référence – toutes ne sont pas porteuse de maladies loin de là, mais il y en a 2 millions quand même et quand on a un cancer, nos cellules cancéreuses ont 25 millions de mutations chacune. »
Et le mouvement d’utilisation de ces données est déjà lancé. John Craig Venter – pionnier du séquençage ADN et dont les laboratoires ont en 2007 livré le premier chromosome artificiel – a lancé récemment une opération séquençant le génome de 10 millions d’Américains, et de rapprocher les résultats de leurs dossiers médicaux(6). Sa firme de San Diego, Human Longevity, a conclu en mars 2016 un accord décenal avec Astrazeneca pour séquencer et analyser les échantillons d’ADN de 500 000 patients.(7)

Données : c’est aussi la came des OCAMs…

Mais les données de santé ne se réduisent bien sûr ni aux informations génétiques, ni à celles regroupées et gracieusement mises à disposition par le SNDS. Elles concernent également le dossier médical et l’ensemble des actes réalisés sur les patients, une manne d’informations qui intéresse nombre d’acteurs privés.
A commencer par les OCAM et leurs bras armé : les réseaux de soins. Ils n’en font d’ailleurs pas mystère, et communiquent à qui mieux mieux sur le sujet. Parmi les derniers exemples en date : un sondage Harris interactive judicieusement publié par la mutualité française le 16 mars 2017 à l’occasion d’un grand raout accueillant alors les candidats à la présidentielle. Ce sondage explique que parmi « ceux qui accepteraient de transmettre à leur mutuelle/assurance leurs données en matière de santé », 72 % seraient disposés à ce que ces données soient liées à leurs médicaments ou traitement médicaux ; 64 % à ce qu’elles soient liées à une maladie dont ils souffriraient ; 60 % à ce qu’elles soient liées à une opération subie. Mais curieusement, la proportion des sondés prêts à ce que leur complémentaire dispose de telles informations ne figure pas dans les résultats du sondage(8).
Qu’importe, puisque la pratique a déjà dépassé les demandes de la communication. Certains réseaux de soins ont tenté d’exiger des professionnels conventionnés qu’ils saisissent mensuellement en ligne,nombre d’informations nominatives quant aux prestations réalisées pour chaque patient. A charge forcément pour les professionnels de recueillir – gratuitement, bien que pour le compte de du réseau – le consentement des assurés à ce que leurs données personnelles soient de la sorte – et toujours gratuitement – transmises au financeur(9).
Ce qui frappe ici, c’est donc l’asymétrie dont bénéficient les OCAMs sur tous les sujets. Tout d’abord, on remarquera qu’ils ont gratuitement accès aux données publiques du SNDS, mais que le SNDS ne disposera qu’à compter de 2019, d’un échantillon de leurs données. Ensuite, les patients sont, sans contrepartie, dessaisis – plus ou moins consciemment et en n’ayant guère le choix – de leurs données de santé, et cela pour le même service qu’auparavant. Enfin, le professionnel de santé se trouve mis à contribution, sans contrepartie. S’il y a dix réseaux de soins, et si les dix procèdent de la sorte, cela voudra dire que les audioprothésistes doivent, toujours sans contrepartie, se connecter à 10 portails, et gérer 10 interfaces et 10 demandes d’informations différentes. Qui plus est pour tendre le bâton avec lequel ils vont se faire battre.

Quel usage ?

Car toute la question est de savoir quel usage va être fait de ces données. Or, à côté des travaux de recherche qu’elles alimentent déjà, l’un de leurs premiers usages est évidemment de mesurer et d’analyser et de décortiquer le travail des professionnels de santé eux-mêmes pour, à partir de là, déterminer des « normes » et des « indicateurs ». Autant de moyen par lesquels le professionnel de santé, est sommé de décrire son travail mais encore de justifier de ses décisions de spécialiste auprès de non-spécialistes.
On n’en est qu’aux balbutiements, mais il y a de premiers signes. Comme cet « Atlas des variations des pratiques médicales »(10), paru en décembre dernier, œuvre croisée d’une membre de la Direction générale de l’offre de soins (DGOS) et d’une directrice de recherche de l’Institut de recherche et de documentation en économie de la santé (Irdès). On y apprend ainsi que le taux de recours à la thyroïdectomie varie du simple à plus du double (de 49 à 122 pour 100 000) selon les départements. Un chiffre intéressant mais dont on devine sans être grand clerc de l’épidémiologie, qu’il l’aurait été encore davantage en rapprochant par exemple cette cartographie des thyroïdectomies d’une cartographie de la prévalence des troubles de la thyroïde ; mieux encore : d’une carte de la prévalence des troubles de la thyroïde nécessitant une thyroïdectomie, le vrai sujet de santé publique étant d’ailleurs très probablement d’expliquer les pics locaux de cette prévalence pour voir s’il n’y a pas en cause des facteurs évitables, tandis que ce que l’on recherche ici, c’est l’opération évitable. Le problème est que, faute d’un tel rapprochement, l’indicateur retenu – ici le nombre d’interventions – est incomplet, si bien que quelque chose comme une suspicion pourrait bien flotter sur les praticiens des régions où les interventions sont les plus nombreuses. Nombre d’articles ont d’ailleurs titré « où a-t-on le bistouri le plus facile » ?(11).
Analyse des auteurs : « Lorsqu’elles ne sont pas justifiées par le besoin des patients, les variations de pratiques médicales posent un problème de nature éthique, thérapeutique et économique. Elles soulèvent la question de la qualité des soins dispensés, de l’équité d’accès aux soins et de l’efficience dans l’allocation de ressources humaines et financières limitées. » Nous y voilà : le nerf de la guerre.
A n’en pas douter, l’inflation du nombre d’informations devant figurer dans les « devis » pour les dispositifs médicaux va dans le même sens : chaque donnée supplémentaire est désormais susceptible d’être ajoutée à une base de données, puis « moulinée » par les experts en optimisation des OCAMs.

Risques

A ce stade, un constat s’impose. Que les financeurs aient pu être échaudés par des pratiques de tarification à la mutuelle – comme cela s’est fait en optique –, cela s’entend et peut avoir contribué à une crise de confiance envers les professionnels de santé – crise de confiance largement cantonnée chez le payeur, car auprès du grand public, si l’image des audioprothésistes n’a pu qu’être endommagée par une série de campagnes à charge, les médecins ont encore, pour l’instant, meilleure presse que les assureurs…
Cela posé, que les professionnels de santé rendent compte de leur activité, tant aux patients qu’aux payeurs, cela se conçoit également. Mais que des indicateurs chiffrés définis largement unilatéralement par le payeur soient l’alpha et l’oméga de l’évaluation de la qualité ou de la pertinence des soins, et partant un critère « d’optimisation » du système de soins, – ce que demandent les OCAM en voulant être reconnus « régulateurs » de la dépense en santé – voilà qui présente de sérieux risques : risque d’harmonisation sur une « norme statistique » alors que la médecine ne s’occupe pas du nombre mais toujours de cas individuels ; risque d’harmonisation sur les pratiques les moins coûteuses.
Auquel cas on passerait de « l’optimisation » à « l’économie » pour le financeur – c’est-à-dire aux bénéfices des assureurs et aux « excédents » des mutuelles, dont le but n’est comme chacun sait pas lucratif.
Et ce dernier risque est d’autant plus élevé que la « discussion » entre professionnels de santé et OCAMs-statisticiens ne peut se faire à armes égales. Une fois élaboré, et quelle qu’en soit la pertinence, le chiffre ou l’indicateur mettent forcément le professionnel de santé en situation de défense. Et qu’y a-t-il de politiquement plus efficace et plus porteur : d’arriver en brandissant un chiffre ? ou de se lancer dans une explication complexe sur les tenants compliqués et les aboutissants nuancés d’une pratique que les spécialistes mettent plusieurs années, parfois plusieurs décennies, à maîtriser ?
On oublie un peu vite dans tout cela que les professionnels de santé gagnent leur vie en soignant les gens, quand le plus rentable pour un financeur est que les gens cotisent plus et soient moins soignés.
Mais dans l’histoire, il n’y a pas que les financeurs.

Autres données, autres acteurs

Car il n’est pas évident de savoir où commence et où s’arrête la donnée médicale, et qui la détient dès lors que le mode de vie entier influe sur la santé. Dans le sondage Harris Interactive déjà mentionné, même les sondés assez audacieux pour être prêts à ce que leur complémentaire sachent de quelle maladie ils sont atteints ne s’y trompent pas et ne souhaitent pas que cette même complémentaire ait accès à des données concernant leur mode de vie. Ces dernières seraient d’ailleurs un excellent moyen pour tout acteur intéressé (employeur, assureur…) de contourner l’anonymisation des données de santé proprement dites (Votre compte Facebook montre que vous pratiquez tel sport depuis au moins telle année ? Il y a donc une probabilité de n% que vous ayez d’ores et déjà tel trouble musculo-squelettique) …
Or, les données sur le mode de vie abondent : sur les réseaux sociaux, et dans les grandes enseignes de commerce en ligne que sont Amazon ou Ebay. Elles sont également appelées à se multiplier avec la multiplication des objets connectés. Certes, lorsqu’il s’agit de leur santé, les Français restent prudents avec ces outils, puisque l’enquête d’Harris Interactive montre que seuls 15 % des sondés en ont déjà utilisé pour obtenir des informations sur leur santé tandis que 62 % n’envisagent pas même de le faire. Pour autant, il ne faut pas perdre de vue les potentialités ouvertes à court terme par une convergence qui transformera à terme tout dispositif médical en objet connecté. D’ores et déjà des fabricants d’appareils auditifs proposent une fonction « journal » qui calcule le temps passé dans différents environnement sonores. Si l’on ajoute à cela la possibilité d’audioprothèses connectées (lire page 28), possibilité de récupérer pléthores de données : sur le comportement des appareillés (au-delà des déclarations dans un sondage : durée et fréquence de port, mode de vie, usage effectif des possibilités de réglages, réglages choisis).
En fait, toutes ces possibilités existent déjà et leur déploiement n’est retenu que par la législation. En mars 2017, un sex-toy canadien – répondant au doux nom de we-Vibe, ça ne s’invente pas – a défrayé la chronique pour avoir transmis à son fabricant et sans le consentement de ses utilisateurs des données « très intimes » dont la fréquence de vibration retenue…
Autant dire que les données portant directement ou indirectement sur la santé, non contentent de se multiplier, se disséminent bien en dehors du strict champ médical et sans pour autant qu’il y ait atteinte au secret professionnel par les équipes soignantes. Les GAFA – pour les non-initiés, Google, Apple, Facebook, Amazon – investissent d’ores et déjà massivement dans la santé, et, portés par leurs « big data » et l’intelligence artificielle, y prendront demain une place que certains, comme Laurent Alexandre, voient déjà clé.

Conglomérat et dystopie

Si tel est le cas, les OCAM ne seront peut-être que le cadet des soucis à se faire. A moins bien sûr que les GAFA n’en rachètent un. Un peu de science-fiction pour finir. Imaginons que, dans pas si longtemps et dans une galaxie pas si lointaine, comme Carte Blanche a déjà sorti ses montures de lunettes, demain, un réseau de soins diffuse « ses » audioprothèses. Celles-ci collectent des données directement transmises à l’assureur et propriétaire d’un réseau social. Fermez les yeux, c’est le meilleur des mondes.

Big data, dirty data ?

« L’intelligence artificielle, explique Laurent Alexandre, sort au robinet des grandes plates formes, pour des raisons que nous savons tous. Il faut beaucoup de données pour développer de l’intelligence artificielle et une étude récente a montré qu’un mauvais algorithme avec beaucoup de data est supérieur à un meilleur algorithme avec pas beaucoup de data ».
Oui, mais quid de la qualité de ces données ? Si la question ne se pose sans doute guère pour ce qui concerne les résultats d’analyse de laboratoire ou d’un séquençage d’ADN, elle devient beaucoup plus sérieuse lorsque l’on en vient aux données cliniques issues par exemple des dossiers de suivi des patients, explique en substance un anesthésiste – remonté – de l’AP-HP qui a préféré rester anonyme.
En effet, observe-t-il, « Tout d’abord, cette qualité est très hétérogène. Ainsi, en ce qui concerne le dossier du chirurgien, sa teneur varie considérablement d’un praticien à l’autre. Tandis que certains renseignent très clairement et précisément leurs indications chirurgicales, tandis que pour d’autres, le dossier ne contient qu’une feuille presque blanche. De son côté, l’anesthésiste – parce que c’est son boulot – tend à avoir les yeux rivés sur le scope plutôt que d’ajouter du blabla aux données du dossier médical. A tous les niveaux, il y a une certaine nonchalance, parce que ça empoisonne tout le monde de noter correctement les choses : oui, c’est le minimum pour la qualité des soins, mais non ce n’est pas le boulot des soignants qui sont épuisés et ne sont ni qualiticiens, ni statisticiens. En outre, ils travaillent souvent dans l’urgence, et nombre de notes au lieu d’être « prises » sont souvent rédigées a posteriori, en décalé – avec donc des erreurs, des simplifications, des inexactitudes. Or s’il n’y a pas de rigueur dans l’acquisition des données, ce qui est chronophage et nécessite une vraie volonté face à l’épuisement des soignants, on ne peut rien faire de sérieux.
« Deuxièmement, les données sont incomplètes et imprécises. Soit un paramètre, la saturation d’oxygène, prise à quel doigt ? on a changé de doigt ? de main ? Idem, la pression artérielle, prise à quel bras ? à la jambe ? Ce n’est généralement pas précisé. La seule parade serait de prendre encore plus de datas, mais on n’a pas de multiscope pour tout mesurer – et en continu en plus. Car il y a aussi le piège de ne doser qu’une seule fois, et de ne pas recommencer pour des raisons d’économies, alors que, parfois, si l’on répétait le dosage 6 fois, on verrait l’évolution et l’on aurait tout compris à ce qui se passe…
« Troisièmement, ce que l’on mesure n’est pas nécessairement ce qui aurait du sens ou ce qui est déterminant. J’aimerais avoir le débit cardiaque, le débit sanguin cérébral, la consommation cérébrale d’oxygène, la profondeur d’anesthésie, mais ce que j’ai en pratique c’est la saturation en oxygène au bout d’un doigt, la pression artérielle, la fréquence cardiaque, le CO2 expiré, l’électroencéphalogramme dont un algorithme me sort 40 secondes plus tard un chiffre qu’il reste encore à évaluer…. Et puis il y a ce que tout le monde oublie et que plus personne ne note : la clinique ! Si le patient a bougé, s’il saigne dans le champ opératoire ? Or sans ces éléments ce qui est noté n’a pas forcément de sens. C’est ce type d’informations qui peut ainsi expliquer certaines des « scopites » – des artefacts du scope qui ne viennent pas du patient.
« Quatrièmement et enfin, quand on dit ‘big data’, on oublie de préciser : ‘big data de quoi’ ? Big data du PMSI ? Si c’est cela, il ne sera pas facile ou très significatif de les utiliser à des fins de recherche médicale car le codage de l’activité pour faire de l’argent est biaisé et donc ne répond pas à la rigueur de la recherche clinique. Le problème – et c’est vrai pour la quasi-totalité des systèmes des saisies – c’est que s’ils ne sont pas ajustables dans le temps et aux besoins des services, le soignant qui note est à la merci de l’exhaustivité et de la flexibilité des menus déroulants ou des QCM qu’il subit… Et quand bien même tout cela serait adaptable aux besoins des équipes, il reste que deux spécialités médicales, ou deux établissements n’emploient pas forcément le même vocabulaire…
« L’ennui, c’est qu’avec tout cela, on construit de soit-disant preuves, pour les tribunaux ou pour l’EBM. Mais ces preuves ne reflètent en rien la réalité de la pratique et des problèmes rencontrés. Ce n’est pas parce qu’il y a des millions d’articles scientifiques qu’ils couvrent plus de 10% du réel… les chercheurs sont chacun dans leur aquarium et en face, il y a l’océan Pacifique…. »

par carine
sur 28 janvier 2018

La bataille des données de santé

Big data, dirty data ?

Les derniers articles

Archives

Rubriques

Méta