La Télé-Ophtalmologie ; une revue de la littérature médicale sur son développement actuel en France.


L'ophtalmologie fait partie des spécialités médicales qui intègrent aujourd'hui la santé numérique, en particulier l'usage de l'IA, et la télésanté dans l'exercice professionnel. Un Think Tank dédié à la télé-ophtalmologie a publié en 2022 un excellent livre blanc consacré à ce sujet (http://catel.pro/documents/collectifs/Livre-blanc-teleophtalmologie.pdf). Cette publication a été suivie d'une journée consacrée à la télé-ophtalmologie le 13 septembre 2024 (l'image du billet).

Le Think Tank Santé Numérique et Télésanté consacre son webinaire de rentrée au thème de la télé-ophtalmologie à l'Outre-mer. Il se tiendra le 7 octobre prochain à 19h30. L'inscription est libre et gratuite. Toute personne intéressée peut se connecter par le lien zoom suivant à partir de 19h15 : https://us02web.zoom.us/j/81032823261?pwd=ittH92gmDluQ7gbMR8I8s73pdGEnV9.1.

Pour permettre aux participants du futur webinaire de connaître le développement actuel de la télé-ophtalmologie en France, ce billet fait un survol des principales publications scientifiques d'équipes françaises qui œuvrent pour le développement des soins visuels distanciels dans le but de réduire les inégalités actuelles d'accès à ces soins.

Ce billet ne fait pas une revue exhaustive de la télé-ophtalmologie en France puisqu'il se limite aux publications scientifiques. Nous avons déjà publié plusieurs billets sur ce blog sur ce thème. Nous invitons le lecteur à les revoir s'il le souhaite :

(https://telemedaction.org/445927157/448700411)(https://telemedaction.org/445927157/450646742)


La téléconsultation en ophtalmologie

[Evaluation of an experiment in ophthalmology telemedicine].Pot E, Guenezan L, Pelen F, Facon G.J Fr Ophtalmol. 2024 Mar;47(3):103986. doi: 10.1016/j.jfo.2023.05.030. Epub 2023 Dec 19.PMID: 38123443


Objectifs

Afin de répondre aux besoins d’accès aux soins visuels sur un territoire déficitaire, un poste avancé en ophtalmologie a été créé. L’objectif principal était de mesurer l’amélioration de l’accès aux soins en ophtalmologie via la téléconsultation.

Méthodes

Aucun critère d’âge, de sexe ou de localisation géographique n’avait été défini. En fonction du motif de la consultation et des résultats des examens menés par un orthoptiste présent physiquement, le patient pouvait bénéficier d’une téléconsultation avec un ophtalmologue. Onze indicateurs ont été choisis pour répondre aux objectifs de l’étude. Les données ont été comparées avec celles d’un centre témoin.

Résultats

La qualité, la sécurité des soins et l’intérêt médical de la téléconsultation n’étaient pas inférieurs au centre de référence. Les consultations ont permis de dépister 25 dégénérescences maculaires liées à l’âge, 240 glaucomes, 229 cataractes et 27 rétinopathies diabétiques. 88,5 % des patients ont été inclus dans un protocole de coopération ophtalmologue/orthoptiste, contre 27,3 % dans le centre témoin (p < 0,0001).

Discussion

Le poste avancé doit être rattaché à un centre principal situé au maximum à une heure de distance. Le matériel utilisé doit être adapté à l’usage de la téléconsultation et permettre à l’orthoptiste des réaliser les bilans et examens nécessaires. Le nombre de passages aux urgences après une téléconsultation réalisée au poste avancé a été plus élevé que dans le centre témoin, ce qui pourrait conduire à une étude complémentaire.

Conclusion

La téléconsultation améliore l’accès aux soins visuels sur un territoire sous-doté en ophtalmologues.


La téléexpertise en ophtalmologie

[Ophthalmology telemedicine at Rennes University Medical Center: Evaluation of the secure platform OMNIDOC during its first year of use].

Bourré T, Costes M, Mouriaux F, Soethoudt M.J Fr Ophtalmol. 2024 Aug 5;47(8):104263. doi: 10.1016/j.jfo.2024.104263. Online ahead of print.PMID: 39106558)


Introduction 

L'ophtalmologie en tant que spécialité est pionnière dans le domaine de la télémédecine. La téléexpertise représente l'un des 5 types de services de télémédecine, avec un volume d'activité croissant dans les hôpitaux universitaires. En novembre 2020, le service d'ophtalmologie du CHR de Rennes a lancé son réseau de téléexpertise avec la plateforme sécurisée OMNIDOC. L'objectif de cette étude était d'évaluer sa contribution au cours de la première année d'utilisation.

Matériels et méthodes

A partir de novembre 2020, les consultations d'ophtalmologie du CHU de Rennes ont été orientées vers le réseau dédié OMNIDOC. Trois cent quarante et une demandes de téléconsultation/ téléexpertise ont été reçues et analysées entre novembre 2020 et octobre 2021. Nous avons envoyé un sondage de satisfaction aux médecins demandeurs et aux médecins consultants afin de déterminer si le réseau était bénéfique ou non.

Résultats

Trois cent vingt-sept téléexpertises demandées par 126 praticiens ont été incluses dans l'étude. Le temps de réponse médian était de 6 heures. Tous les domaines de la spécialité étaient concernés, dont 22,3 % concernaient des patients pédiatriques de moins de 6 ans. Parmi les demandes, 89,7% étaient régionales (Bretagne) et provenaient majoritairement d'ophtalmologistes (61,77%). Près d'un patient sur deux n'a pas nécessité de consultation en présentiel au CHU de Rennes.

Discussion

La mise en place d'un réseau de téléexpertise a permis d'accéder à un avis d'ophtalmologie médicale rapide et facilitée. Une telle plateforme assure la sécurité et la traçabilité des interactions. Il permet d'enrichir et d'optimiser le parcours de soins des patients et de favoriser les relations avec les médecins traitants de proximité.


L'usage de l'IA générative pour le dépistage des pathologies visuelles

Towards population-independent, multi-disease detection in fundus photographs. Matta S, Lamard M, Conze PH, Le Guilcher A, Lecat C, Carette R, Basset F, Massin P, Rottier JB, Cochener B, Quellec G.Sci Rep. 2023 Jul 17;13(1):11493. doi: 10.1038/s41598-023-38610-y.PMID: 37460629


Objectif

Aucune étude n'a encore validé un algorithme de dépistage automatisé de plusieurs maladies visuelles dans un scénario où les données de test sont très différentes des données d'entraînement. Nous évaluons des algorithmes DL (Deep Learning) dans des scénarios où les données d'entraînement et de test proviennent de différentes populations, données acquises avec différentes caméras et annotées selon différents protocoles.

Méthodes

Les ensembles de données suivants sont pris en compte : OPHDIAT (France, population diabétique), OphtaMaine (France, population générale), RIADD (Inde, population générale) et ODIR (Chine, population générale).

Les maladies suivantes sont ciblées : diabète (D), glaucome (G), cataracte (C), DMLA (A), hypertension (H), myopie (M) et autres maladies/anomalies (O). Chaque ensemble de données a été initialement étiqueté pour un ensemble différent d'anomalies oculaires, avec sa propre taxonomie : pour les besoins de cette étude, les annotations du terrain ont été unifiées rétrospectivement selon le système de classe d'annotation ODIR. (Li, N., Li, T., Hu, C., Wang, K. & Kang, H. A benchmark of ocular disease intelligent recognition: one shot for multi-disease detection. in International Symposium on Benchmarking, Measuring and Optimization 177–193 (Springer, 2020).)

Nous émettons l'hypothèse que l'entraînement conjoint d'un algorithme d'apprentissage à distance sur plusieurs ensembles de données, à partir de populations distinctes, entraînera une amélioration de la généralité par rapport à un algorithme d'apprentissage par ordre entraîné sur un seul ensemble de données.

Pour évaluer cette hypothèse, deux scénarios sont envisagés dans cette étude. Dans un premier scénario, inspiré des solutions DL disponibles dans le commerce, l'algorithme est entraîné sur un grand ensemble de données collectées auprès d'une population diabétique dépistée pour la rétinopathie diabétique, à savoir OPHDIAT (Massin P, et al. OPHDIAT©: A telemedical network screening system for diabetic retinopathy in the Île-de-France. Diabetes Metab. 2008;34:227–234. doi: 10.1016/j.diabet.2007.12.006).

Dans un deuxième scénario, l'algorithme est entraîné sur plusieurs ensembles de données simultanément. Les réseaux DL qui en résultent sont appelés respectivement réseau SD (Single-Dataset) et MD (Multiple-Dataset). Dans les deux scénarios, nous étudions les performances de classification chaque fois que les données d'entraînement et de test proviennent de populations qui se chevauchent (bien que ce soient des patients différents) ou de populations disjointes.

Résultats

Au total, 77 827 images d'OPHDIAT, 17 120 images d'OphtaMaine, 3 200 images du RIADD et 10 000 images de l'ODIR ont été incluses dans cette étude. Chacun de ces jeux de données a été divisé en un sous-ensemble d'entraînement, un sous-ensemble de validation et un sous-ensemble de test.

Dans la communication de nos résultats, nous ne prenons en compte que les catégories de maladies contenant au moins 10 images de test (pour OPHDIAT et RIADD) ou 10 examens de test (pour ODIR et OphtaMaine).

Analyse du ROC

La courbe ROC (Receiver Operating Characteristic) représente la sensibilité en fonction de 1-la spécificité pour toutes les valeurs seuils possibles du marqueur étudié. La sensibilité est la capacité du test à bien détecter les malades et la spécificité, la capacité du test à bien détecter les non-malades).

Afin d'évaluer le caractère généralisable des deux réseaux SD et MD, des tests hors domaine pour la détection de plusieurs maladies ont été effectués pour le réseau SD et pour le réseau DM. Le tableau ci-dessous présente l'aire moyenne sous la courbe caractéristique du récepteur (mAUC) pour les quatre sous-ensembles d'essai, à la fois pour le réseau SD et pour le réseau MD, entraînés soit à l'aide de l'entraînement K=3 et des sous-ensembles de validation K=3 correspondants (désignés par l'expression entraînement/validation) (en laissant un ensemble de données de côté), soit à l'aide de tous les sous-ensembles d'apprentissage et de validation (K=4).

Les résultats montrent que tous les réseaux ont obtenu de bons résultats sur des sous-ensembles de tests provenant d'une des populations impliquées dans l'entraînement. Cependant, leurs performances étaient moins bonnes lorsqu'elles étaient testées sur des données provenant d'une population jusqu'alors inconnue.

Par exemple, sur le sous-ensemble de tests OPHDIAT :

  • la mAUC était de 0,9571 pour le réseau SD entraîné sur OPHDIAT,
  • la mAUC obtenue avec les sous-ensembles de formation/validation K=3, en excluant OPHDIAT, était de 0,8433,
  • la pire mAUC obtenue avec les sous-ensembles d'entraînement/validation K=3, en incluant OPHDIAT, était de 0,9363,
  • le mAUC obtenu avec tous les sous-ensembles d'entraînement/validation K=4 était de 0,9409.






















Discussion

Cette étude suggère que le développement d'un algorithme DL provenant de différentes populations est très difficile. Malgré l'amélioration des performances à l'aide du réseau MD, il n'est toujours pas capable d'être généralisé à des données très différentes des données d'entraînement. Une explication possible est qu'il existe une variabilité dans l'interprétation des photographies du fond d'œil entre les différents ensembles de données.

En fait, la portée de chaque ensemble de données est différente, car elle dépend de l'objectif de filtrage pour lequel l'ensemble de données a été collecté. De plus, même si une image est partagée entre deux ensembles de données, sa définition peut varier en raison de différents critères d'annotation. Cela pourrait aussi être en partie lié à l'inadéquation des origines professionnelles des lecteurs d'image (par exemple, libéral pour OphtaMaine et pratique hospitalière pour OPHDIAT).

De plus, les schémas d'anomalie peuvent différer d'une population à l'autre : l'emplacement, la forme et l'aspect des lésions peuvent ne pas être les mêmes. Les performances de l'algorithme DL pourraient également être affectées par la fréquence de chaque anomalie dans chaque ensemble de données. Par exemple, étant donné que les données d'OPHDIAT  correspondent au dépistage dans une population diabétique, la rétinopathie diabétique est la pathologie la plus courante dans l'ensemble de données OPHDIAT. En revanche, étant donné qu'OphtaMaine cible une population générale, le glaucome est la pathologie la plus courante dans l'ensemble de données OphtaMaine. Enfin, il existe une variation possible en termes de données d'imagerie collectées qui peut affecter les performances de l'algorithme.

Conclusions

Cette étude souligne l'importance d'évaluer le caractère généralisable d'un algorithme DL. À cette fin, le système de classes d'annotation ODIR a été proposé en tant que classification unifiée, en raison de l'absence de classification internationalement reconnue. Les résultats ont montré que le réseau SD, entraîné sur un seul grand jeu de données, n'est pas généralisable à des nouvelles données très différentes des données d'entraînement.

Pour remédier à ce problème, nous avons proposé un algorithme pour le réseau MD qui a significativement amélioré les performances sur de nouvelles données. Cette stratégie pourrait être intégrée dans un scénario d'apprentissage sur des données de santé multicentriques. Dans ce contexte, les utilisateurs d'algorithmes DL (centres cliniques) peuvent largement bénéficier de leur participation à l'enrichissement des systèmes, car les performances seront nettement supérieures.

Dans le cadre de nos travaux futurs, nous développerons et évaluerons des solutions d'apprentissage par apprentissage distribuées et sécurisées pour l'entraînement multicentrique des algorithmes de dépistage de pathologie oculaire (projet LabCom ADMIRE). La résolution de ces défis ouvrira la voie au déploiement à grande échelle des algorithmes DL et au dépistage de nombreuses maladies visuelles.


30 septembre 2024


Rendez-vous au prochain webinaire du 7 octobre 19h30, inscription libre et gratuite : https://us02web.zoom.us/j/81032823261?pwd=ittH92gmDluQ7gbMR8I8s73pdGEnV9.1.