Pour son 5ème anniversaire, la prestigieuse revue anglaise

THE LANCET Digital Health

fait un point sur les preuves scientifiques démontrant un impact de l'IA dans la pratique médicale clinique.


Célébrant son 5ème anniversaire, la prestigieuse revue anglaise THE LANCET Digital Health fait un point sur les preuves scientifiques obtenues au cours des 5 dernières années qui  démontrent un impact de l'IA sur la pratique médicale clinique.

Nous reproduisons ici l'intégrité de cet éditorial.


5 years of The Lancet Digital Health.

Sarkar R, Samuel D, Dunbar L, Monnerat G.Lancet Digit Health. 2024 May;6(5):e299. doi: 10.1016/S2589-7500(24)00073-6.PMID:38670735

https://www.thelancet.com/journals/landig/article/PIIS2589-7500(24)00073-6/fulltext


Il y a 5 ans, le domaine de la santé numérique était en surexcitation, malgré le peu de substance. Lorsque nous avons lancé le journal en mai 2019, nous étions ambitieux, mais prudents. Nous avons cherché à amplifier les recherches rigoureuses qui explorent le potentiel de la santé numérique, et nous avons clairement reconnu et critiqué les difficultés que rencontrait ce domaine pour progresser rapidement. À l’occasion de notre 5e anniversaire, nous réfléchissons aux impacts des contributions de chercheurs sur la pratique clinique et sur la politique de recherche. Nous posons la question : «La santé numérique a-t-elle déjà transformé la médecine ?»


À première vue, cela ne semble pas être le cas. L'évolution rapide de la technologie a dépassé notre capacité à comprendre ses implications et, en tant qu'éditeurs d'un journal scientifique, nous reconnaissons nos propres limites et biais.

Au cours de la première année du Journal, Liu et ses collègues (https://www.thelancet.com/journals/landig/article/PIIS2589-7500(19)30123-2/fulltext) ont publié une revue séminale qui révélait que moins de 1 % des études d'intelligence artificielle (IA) sur l'imagerie médicale répondaient aux normes de qualité scientifique qui leur permettraient d'être adoptées en clinique.


Denniston et Liu (https://www.thelancet.com/journals/landig/article/PIIS2589-7500(24)00071-2/fulltext) ont commenté ce que disent la plupart des journaux qui tentent de maintenir des normes de publication face à l'afflux d'études sur l'IA :

"La façon dont nous parlons de l'IA reflète souvent ce que nous pensons qu'elle devrait être, plutôt que d'être basée sur des preuves réelles" ou "le flou et l'ampleur de la promesse de l'IA, ce qui permet à chacun d'entre nous de construire ses propres hypothèses autour de son opportunité". "

"L'omniprésence de l'IA dans les médias, la fiction et l'électronique grand public, peut donner une impression non fondée de capacité, y compris dans le contexte des soins de santé, et parfois un espoir de solution facile à notre crise sanitaire, pour laquelle nous nous tournons vers l'IA en tant que fournisseur de soins de santé de haute qualité à faible coût, 24 heures sur 24 et 7 jours sur 7, dans le but de remédier à l'inadéquation actuelle entre l'offre et la demande, et pour réduire notre dépendance à l'égard de ces composants faillibles et imparfaits du système de soins de santé que sont les humains".


Pour expliquer ces constats, Han et ses collègues (https://www.thelancet.com/journals/landig/article/PIIS2589-7500(24)00047-5/fulltext) soulignent la prédominance d'essais d'IA monocentriques avec des rapports démographiques insuffisants, ainsi que des résultats variables sur l'efficacité opérationnelle, ce qui soulève des doutes sur le caractère généralisable de tels résultats dans la pratique clinique.


Muehlematter et ses collègues (https://www.thelancet.com/journals/landig/article/PIIS2589-7500(20)30292-2/fulltext) ont souligné le nombre croissant de dispositifs médicaux fondés sur l'IA, bénéficiant d'une approbation réglementaire aux États-Unis et en Europe, malgré une transparence insuffisante des procédures de réglementation et d'approbation pour garantir la sécurité des données et la confiance du public.


Ces études, et bien d'autres, ont entraîné des changements significatifs dans l'exigence de normes scientifiques, aboutissant à des avancées méthodologiques telles que les recommandations de CONSORT-AI (https://www.thelancet.com/journals/landig/article/PIIS2589-7500(20)30218-1/fulltext),

CONSORT-AI recommande aux chercheurs de fournir des descriptions claires de l'intervention d'IA, y compris les instructions et les compétences requises pour l'utilisation, le cadre dans lequel l'intervention d'IA est intégrée, la gestion des entrées et des sorties de l'intervention d'IA, l'interaction homme-IA et la fourniture d'une analyse des cas d'erreur. CONSORT-AI contribue à promouvoir la transparence et l'exhaustivité dans la déclaration des essais cliniques pour les interventions d'IA. Il aidera les rédacteurs et les pairs examinateurs, ainsi que le lectorat général, à comprendre, interpréter et évaluer de manière critique la qualité de la conception des essais cliniques et le risque de biais dans les résultats rapportés.

les recommandations de CODE-EHR (https://www.thelancet.com/journals/landig/article/PIIS2589-7500(22)00151-0/fulltext)

La Société européenne de cardiologie et le consortium BigData@Heart ont réuni un éventail de parties prenantes internationales, notamment des représentants de patients, de cliniciens, de scientifiques, de régulateurs, de rédacteurs en chef de revues et de membres de l'industrie. Dans cette revue, nous proposons le cadre de normes minimales CODE-EHR à utiliser par les chercheurs et les cliniciens pour améliorer la conception des études et accroître la transparence des méthodes d'étude. Le cadre CODE-EHR vise à développer une utilisation robuste et efficace des données de soins de santé à des fins de recherche.

celles de DECIDE-AI (https://www.bmj.com/content/377/bmj-2022-070904)

La présente déclaration fournit une ligne directrice de rapport multipartite et consensuelle pour les systèmes d'aide à la décision (DECIDE-AI) pour les enquêtes cliniques exploratoires et développementales des systèmes d'aide à la décision pilotés par l'intelligence artificielle (DECIDE-AI). Nous avons mené un processus Delphi modifié en deux tours pour recueillir et analyser l'opinion d'experts sur le rapport de l'évaluation clinique précoce des systèmes d'IA. Des experts ont été recrutés dans 20 catégories de parties prenantes prédéfinies. La composition et le libellé définitifs de la directive ont été déterminés lors d'une réunion de consensus virtuelle. La liste de contrôle et les sections Explication et élaboration ont été peaufinées en fonction des commentaires d'un processus d'évaluation qualitative. 123 experts ont participé à la première série de Delphi, 138 à la deuxième, 16 à la réunion de consensus et 16 à l'évaluation qualitative. La directive de déclaration DECIDE-AI comprend 17 éléments de déclaration spécifiques à l'IA (composés de 28 sous-éléments) et 10 éléments de déclaration génériques, avec un paragraphe E&E prévu pour chacun. Grâce à la consultation et au consensus d'un éventail de parties prenantes, nous avons élaboré une ligne directrice comprenant des éléments clés qui devraient être rapportés dans les études cliniques de stade précoce des systèmes d'aide à la décision basés sur l'IA dans les soins de santé. En fournissant une liste de contrôle exploitable des éléments de rapport minimaux, la directive DECIDE-AI facilitera l'évaluation de ces études et la reproductibilité de leurs résultats.

Tous ces comités d'experts en IA, avec leurs recommandations, ont permis de fait face à l'assaut de publications sur l'IA, en renforçant la nécessité pour les auteurs de montrer leur application clinique.


Plusieurs publications, dont le point de vue de Ghassemi et ses collègues (https://www.thelancet.com/journals/landig/article/PIIS2589-7500(21)00208-9/fulltext) estiment que les recommandations sur la question de savoir si l'IA dans le domaine de la santé peut ou doit être expliquée, ont ouvert la voie à une nouvelle génération d'études plus rigoureuses.

Les audits algorithmiques médicaux, tels que ceux décrits par Liu et ses collègues (https://www.thelancet.com/journals/landig/article/PIIS2589-7500(22)00003-6/fulltext) sont essentiels pour répondre aux biais perpétués par l'IA et exacerbés par les technologies émergentes telles que les grands modèles de langage, comme GPT-4, (https://www.thelancet.com/journals/landig/article/PIIS2589-7500(23)00225-X/fulltext)

En outre, étant donné que l'IA et les mégadonnées deviennent essentielles pour les applications de santé, la reconnaissance de l'impact climatique des émissions associées à cette technologie devient une priorité. Des travaux essentiels de Vafaei Sadr et ses collègues (https://www.thelancet.com/journals/landig/article/PIIS2589-7500(23)00219-4/fulltext) ont décrit des stratégies pour améliorer la soutenabilité environnementale de l'apprentissage profond en pathologie.


Malgré la lenteur des progrès due à une recherche devenue plus exigeante, le monde a changé au cours de la moitié de la décennie écoulée, accélérant l'utilisation de cette technologie dans les soins de santé. Au cours de la pandémie de COVID-19, nous avons vu le potentiel des applications portables (https://www.nature.com/articles/s41591-020-1123-x) pour prévoir la propagation des maladies et l'utilisation de l'IA pour le repositionnement personnalisé des médicaments (https://www.thelancet.com/journals/landig/article/PIIS2589-7500(20)30192-8/fulltext)

Avec le vieillissement de la population mondiale et le personnel de santé surchargé de travail, nous avons célébré l'année dernière des progrès majeurs en oncologie, avec deux essais d'IA sur le dépistage du cancer du sein montrant la possibilité de réduire la charge de travail des radiologues sans compromettre la qualité des soins (https://www.thelancet.com/journals/lanonc/article/PIIS1470-2045(23)00298-X/abstract).


Si les progrès dans les pays à revenus élevés sont lents mais réguliers, d'autres défis persistent dans le reste du monde, ce qui crée une fracture numérique mondiale (https://www.thelancet.com/journals/lancet/article/PIIS0140-6736(24)00302-7/abstract).

La médiocrité des infrastructures, la faible disponibilité des données et la pénurie de personnel de santé exacerbent cet écart, soulignant la nécessité d'équité, de responsabilité et d'inclusion pour faire en sorte que la mise en œuvre du monde réel atteigne toutes les populations de la planète.

Depuis la création de notre revue, nous avons défendu l'utilisation de la technologie numérique pour progresser vers un système de soins de santé universel, aligné sur les objectifs de développement durable de l'OMS. Notre plaidoyer s’étend au soutien d’études fondamentales dans les régions à faibles ressources, telles que la recherche sur la santé grâce à la santé mobile et l’IA en Afrique, études qui autonomisent les professionnels de la santé, améliorent le diagnostic et améliorent l’accès aux soins (https://www.thelancet.com/journals/landig/article/PIIS2589-7500(22)00255-2/fulltext)(https://www.thelancet.com/journals/landig/article/PIIS2589-7500(19)30004-4/fulltext) (https://www.thelancet.com/journals/landig/article/PIIS2589-7500(21)00083-2/fulltext)


Nous entrons dans une nouvelle phase de la médecine assistée par la technologie numérique, accélérée par l'IA générative. La promesse de modèles de médecine à usage général, comme la prévision des conditions de santé d'un individu (https://www.thelancet.com/journals/landig/article/PIIS2589-7500(24)00025-6/fulltext), pourrait améliorer notre pratique actuelle d'éducation médicale, de parcours de soins des patients et d'aide à la décision en matière de soins de santé. Plus que jamais, il est urgent d'évaluer de manière transparente l'IA générative et les grands modèles de langage avant de les intégrer dans les soins cliniques.


Compte tenu de ces défis, nos efforts pour favoriser un dialogue diversifié et inclusif sont permanents, et nous demeurons déterminés à amplifier les voix sous-représentées. Nous exprimons notre profonde gratitude à notre conseil consultatif international, à nos pairs examinateurs, à nos auteurs, auditeurs et lecteurs pour leurs contributions et leur dévouement inestimables alors que nous nous efforçons tous d'instaurer un monde plus juste et plus connecté.



COMMENTAIRES. Cette mise au point sur l'IA (médicale) de la part d'une revue scientifique qui fait l'unanimité dans le monde de la santé nous a semblé importante à faire connaître sur ce blog, pour au moins trois raisons.
La première est résumée dans ces phrases si réelles : "La façon dont nous parlons de l'IA reflète souvent ce que nous pensons qu'elle devrait être, plutôt que d'être basée sur des preuves réelles" ou  "le flou et l'ampleur de la promesse de l'IA qui permettent à chacun d'entre nous de construire ses propres hypothèses autour de son opportunité", ou encore "l'omniprésence de l'IA dans les médias donnant une impression non fondée de capacité à apporter une solution à notre crise sanitaire.". La plupart d'entre nous vivons chaque jour cette surinformation sur l'IA en santé, souvent non encore fondée sur des preuves.
La deuxième raison est la mise en place par des groupes d'experts multidisciplinaires dans le domaine de l'IA d'un cadre scientifique rigoureux qui manquait jusqu'à présent (CONSORT-AI, CODE-EHR, DECIDE-AI), lequel devrait permettre aux futures études d'apporter la preuve d'un réel service rendu par l'IA dans la pratique clinique.
La troisième raison est rassurante. C'est la reconnaissance par les auteurs de cet éditorial de premiers résultats probants dans le dépistage du cancer du sein par l'IA. Il y a probablement d'autres résultats aussi probants qui n'ont pas été publiés dans cette revue prestigieuse. Il sera possible désormais de juger ces études à partir du cadre scientifique défini de manière consensuelle par les groupes d'experts en IA médicale.

28 juin 2024