J'ai lu l'article de Simon Woillet sur le Health Data Hub sur le très bon site de gauche Le Vent se lève.
L'article m'a énormément déçu par ses imprécisions et ses erreurs. J'avais commencé une série de tweets pour y répondre, puis je me suis dit qu'un article plus complet était sans doute préférable.
Je tiens à dire que je n'ai rien contre Simon Woillet que je ne connais pas et qui avait très certainement de bonnes intentions. Je n'ai rien non plus contre LVSL qui reste, selon moi, un des meilleurs journaux de gauche actuels.
L'article original est disponible ici .
1 - L'auteur n'a pas compris ce que faisait le datahub.
Le datahub fournit des données issues du monde de la santé.
Il n'interprète pas de données, il ne les exploite pas, il n'utilise pas d'algorithme d'IA.
S'il a été créé dans le cadre d'un plan "d'intelligence artificielle", il n'en fait pas.
Peut-être que des gens qui exploiteront ces données appliqueront des algo issus du monde l'IA.
Mais lui n'en utilise pas. Il se contente de fournir des données.
2 - Sur la critique de l'hébergement Microsoft Azure.
Alors oui, Microsoft, c'est de la merde et il faudrait du logiciel libre partout.
Mais toutes ces plateformes d'hébergement en ligne (Google cloud, AWS..) proposent des versions de leur serveur hébergé en Europe.
Il faudrait regarder de plus près, mais comme tout ce que fait l’État, c'est sûrement hébergé en Europe pour, justement, sortir du "patriot act" américain.
Je ne dis pas que c'est parfait, mais si toutes les boites du CAC40, qui ont d'énormes questions d'espionnage industriel font confiance dans ces serveurs européens c'est qu'il y a peut-être une raison.
3 - Sur les hébergeurs alternatifs.
Dans l'article il y a une grosse confusion entre les machines, les sociétés qui louent l'accès à ces machines, les logiciels (libres ou pas) permettant de faire de la gestion de ces machines virtuelles et les logiciels qui permettent de servir ces données…
Je ne rentre pas dans les détails parceque ca n'est pas très interessant, mais l'article est très confus.
Si quelqu'un me demande sur twitter, je pourrai faire un point sur le sujet.
4 - "L’État français disposera d’un Cloud interne en 2020 pour les services les plus stratégiques"
C'est juste faux.
Le ministère de l'Intérieur a un département DINSIC qui gère un cloud qui héberge déjà plein de services. (J'ai bossé avec eux il y a 2 ans, ils sont très cool d'ailleurs)
5 - Il y a une nouvelle confusion quand il parle de "libre communication de l’information à caractère scientifique (open source)"
Si c'est de l'information, il faut parler de "Open Data". "L'open-source" , c'est parler des logiciels qu'on utilise.
D'ailleurs, et c'est le fond de mon désaccord sur le sujet. Comment on peut être pour l'open-data d'un coté et refuser que l’État redistribue les données (anonymisées) de santé produites par l’État ? Il y a un problème dans le raisonnement.
Pour moi, ces données doivent être anonymes, publiques, gratuites et accessibles simplement par des informaticiens (Par exemple, en fournissant une API de type REST )
7 - Sur le "consentement présumé".
Je suis d'accord dans le principe, mais il faudrait aller dans le détail pour savoir de quoi on parle vraiment. Prenons le cas de la grippe : Voir l'évolution du nombre de grippes dans un département année après année me semble d'utilité publique.
Ne pas demander à chaque patient s’il veut faire partie de ces statistiques anonymes me semble embêtant, mais pas de là à parler de « sociétés de contrôle » ou de « capitalisme de surveillance » comme le dit l'auteur.
8 - Je passe sur les questions de recrutement où je suis tout à fait d'accord
Mais je ne vois pas bien le rapport avec le reste de l'article… L'article retourne vite d'ailleurs aux questions de l'hébergement par Microsoft Azur…
9 - Sur la question de la centralisation de l'information.
Je suis d'accord pour dire que techniquement, ça pose des risques de piratage.
Mais le data Health hub s'occupe de l'anonymisation des données. Une fois qu'elles sont anonymisées, il n’y a plus vraiment de problème à être piraté…
Par ailleurs, la décentralisation de l'information est encore plus dangereuse !
Avoir 10 systèmes d'informatique différents nécessite 10 fois plus d'acteurs et de transferts pour recouper l'information. Il faut donc sécuriser 10 fois plus de points… Pas sûr du tout qu'on y gagne !
10 - Je passe sur les scandales de corruption dans le médicament.
Bien que ce soit très intéressant, cela ne me semble absolument pas lié à la question du Health Data Hub.
11 - Sur l'OpenEHR de l'OMS
Voilà une perspective intéressante ! Pourquoi ne l'évoquer que sur 2 lignes à la fin de l'article ?
12 - Conclusion : Tout se mélange !
On oppose les coupes budgétaires dans le milieu hospitalier avec l'ouverture des datas du milieu médical. On parle de Saint-Simon, de la domination américaine et de ses perspectives "occidentalo-centrées". Ça va dans tous les sens pour dire au final que big pharma c'est mal…
Si j'avais du écrire l'article…
Voilà comment j'aurais fait :
- Il y a des données dans le domaine médical qui ont été produites par l’État
- Il faut rendre ces données anonymes, publiques et gratuites pour faire grandir la science
- L'état doit garentire l' anonymisation de ces données médicale
- Ces données appartiennent aux citoyens, associations, chercheurs mais aussi aux entreprises !
- C'est la mission du Health Data Hub français de publier ces donnés après les avoir anonymysé
- Des efforts sont faits sur l'utilisation de logiciels libre , mais l'utilisation de Microsoft Azur est très dommage. Il faut bannir tous les GAFAM du service public
- L'hébergement des datas doit être fait sur le sol européen
- Les données devraient être fournies sous la forme d'API REST (Format utilisable pour des informaticiens) et/ou sous format CSV (tableur) quand c'est utile pour le grand publique
- Les investissements dans ce hub ne doivent en aucun cas rogner sur le budget des hôpitaux et de la médecine en général
Conclusion
L'écriture est chique, les phrases claquent, mais l'auteur souffre d'un manque de connaissances sur le sujet et fait part de beaucoup trop d'imprécisions. Simon Woillet, dont je parie qu'il est passé par l'institue de sciences politiques de Paris, a certainement de bonnes intentions. Mais je ne peux pas m'empêcher de dire que ce genre d'article discrédite notre camp (la gauche) auprès d'informaticiens et de scientifiques. Laissons cela à Villani et ses amis !