La santé publique par satellite : comment l'imagerie par satellite combinée à l'IA peut contribuer à plus d'efficacité dans le dépistage des maladies humaines.

Nous rapportons dans ce billet le récent éditorial paru en juillet 2024 dans The Lancet Digital Health, éditorial consacré à l'apport de l'imagerie satellitaire traitée par l'IA en Santé publique.

The lofty heights of digital health. The Lancet Digital Health.Lancet Digit Health. 2024 Jul;6(7):e433. doi: 10.1016/S2589-7500(24)00122-5.PMID:38906604

Les technologies spatiales sont depuis de nombreuses années un partenaire précieux pour la recherche en santé publique et mondiale.

L’une de ces technologies est la télédétection, qui consiste à acquérir des données à distance par des capteurs installés sur des satellites d’observation de la Terre.

Les données recueillies comprennent des images spatiales et temporelles de la Terre qui, combinées à des données de santé, peuvent identifier des caractéristiques géographiques susceptibles d’être associées à des maladies humaines.

Comment l’intelligence artificielle (IA) peut-elle être utilisée pour accroître l’utilisation de ces images ?

La combinaison de l'imagerie satellite et de l'IA peut aider à répondre aux épidémies de maladies infectieuses.

Les épidémies communautaires de légionellose aux États-Unis ont été associées aux tours de refroidissement qui traitent les systèmes d'air et d'eau des bâtiments. Si elles sont mal entretenues, ces tours peuvent abriter des bactéries Legionella qui peuvent être dispersées par les ventilateurs des tours.

Les registres des tours étant rares, la réponse aux épidémies nécessite l'identification des tours locales par une inspection manuelle des images satellites, ce qui prend du temps. Dans ce numéro du The Lancet Digital Health, Karen K Wong et ses collègues ont automatisé ce processus en utilisant un modèle d'apprentissage profond en deux étapes pour détecter et classer les tours de refroidissement dans les images satellite des villes américaines. Le modèle a pu détecter les tours de refroidissement avec une grande précision et plus de 600 fois plus rapidement que les épidémiologistes spécialisés dans l'identification de ces tours. Il s'agit du premier outil de détection spécifiquement conçu pour faciliter les enquêtes sur les épidémies de légionellose, et il est actuellement utilisé par les Centers for Disease Control and Prevention.

Automated cooling tower detection through deep learning for Legionnaires' disease outbreak investigations: a model development and validation study. Wong KK, Segura T, Mein G, Lu J, Hannapel EJ, Kunz JM, Ritter T, Smith JC, Todeschini A, Nugen F, Edens C.Lancet Digit Health. 2024 Jul;6(7):e500-e506. doi: 10.1016/S2589-7500(24)00094-3.PMID:38906615

Contexte

Les tours de refroidissement contenant des Légionelles constituent une source à haut risque d'épidémies de légionellose. La localisation manuelle des tours de refroidissement à partir d'images aériennes lors d'enquêtes sur les épidémies nécessite une expertise, une main-d'œuvre importante et peut être sujette à des erreurs. Nous avons cherché à former un modèle de vision par ordinateur basé sur l'apprentissage profond pour détecter automatiquement les tours de refroidissement visibles depuis les airs.

Méthodes

Entre le 1er et le 31 janvier 2021, nous avons extrait des images satellite de Philadelphie (PN, USA) et de l'État de New York (NY, USA) à partir de Google Maps et annoté des tours de refroidissement pour créer des ensembles de données d'entraînement. Nous avons augmenté les données d'entraînement avec des données synthétiques et un étiquetage assisté par modèle de villes supplémentaires. À l'aide de 2051 images contenant 7292 tours de refroidissement, nous avons formé un modèle en deux étapes à l'aide de YOLOv5, un modèle qui détecte les objets dans les images, et d'EfficientNet-b5, un modèle qui classe les images. Nous avons évalué les principaux résultats de sensibilité et de valeur prédictive positive (VPP) du modèle par rapport à l'étiquetage manuel sur des ensembles de données de test de 548 images, y compris de deux villes non vues lors de la formation (Boston [MA, USA] et Athens [GA, USA]). Nous avons comparé la vitesse de recherche du modèle à celle de la recherche manuelle par quatre épidémiologistes.

Résultats

Le modèle a identifié des tours de refroidissement visibles avec une sensibilité de 95,1 % (IC à 95 % 94,0–96,1) et une VPP de 90,1 % (IC à 95 % 90,0–90,2) à New York et à Philadelphie. À Boston, la sensibilité était de 91,6 % (89,2–93,7) et la VPP de 80,8 % (80,5–81,2). À Athènes, la sensibilité était de 86,9 % (75,8–94,2) et la VPP de 85,5 % (84,2–86,7). Pour une zone de New York englobant 45 pâtés de maisons (0,26 mile carré), le modèle a recherché plus de 600 fois plus vite (7,6 s ; 351 tours de refroidissement potentielles identifiées) que les enquêteurs humains (moyenne 83,75 min [SD 29,5] ; moyenne 310,8 tours de refroidissement [42,2]).

Conclusions

Le modèle pourrait être utilisé pour accélérer les enquêtes et le contrôle à la source lors d'épidémies de légionellose grâce à l'identification des tours de refroidissement à partir d'images aériennes, ce qui pourrait potentiellement empêcher une propagation supplémentaire de la maladie. Le modèle a déjà été utilisé par les équipes de santé publique pour des enquêtes sur les épidémies et pour initialiser des registres de tours de refroidissement, qui sont considérés comme les meilleures pratiques pour prévenir et répondre aux épidémies de légionellose.

Autres applications

Bien qu’il s’agisse de la première fois que l’IA est utilisée pour la détection automatisée des tours de refroidissement, elle a déjà été utilisée pour détecter d’autres contenants d’eau susceptibles de transmettre des maladies, comme les réservoirs d’eau et les piscines, qui peuvent servir de sites de reproduction aux moustiques Aedes aegypti.

Aedes aegypti est un vecteur de plusieurs arbovirus, dont la dengue, le virus Zika et le chikungunya. L’automatisation de la détection des sites de reproduction potentiels peut donc optimiser la lutte antivectorielle en spécifiant les cibles des inspections sur le terrain par les responsables de la santé publique.

Le potentiel à l'échelle mondiale et en santé publique de l’imagerie satellite et de l’IA ne se limite pas aux maladies infectieuses. Grâce à l’apprentissage profond, des caractéristiques dérivées d’images satellite de l’environnement bâti ont été associées à la prévalence des maladies cardiovasculaires et métaboliques, de l’obésité et du cancer.

Il a également été constaté que ces caractéristiques basées sur des images ont un effet additif au-delà des facteurs démographiques et socioéconomiques et des déterminants sociaux des indices de santé.

Il convient de noter que des caractéristiques telles que les autoroutes et les bâtiments délabrés sont souvent associées positivement à une prévalence plus élevée de maladies, mais une association opposée est constatée pour les installations de loisirs et les espaces verts. De telles conclusions peuvent aider à éclairer les interventions de santé publique pour atténuer les regroupements régionaux de maladies et influencer les politiques d’urbanisme et de réaménagement des régions les plus défavorisées afin de réduire les disparités en matière de santé.

Mais l’IA a besoin de données.

Bien que la disponibilité mondiale des données d’imagerie satellite puisse augmenter, les données régionales sur la santé et les variables environnementales pertinentes peuvent être rares.

La collecte de ces données est également laborieuse et coûteuse (en particulier dans les cas où des images haute résolution ou une surveillance en temps réel des variables sont nécessaires), et peut donc ne pas être réalisable, en particulier dans les régions aux ressources limitées comme les pays à revenu faible et intermédiaire.

Dans une certaine mesure, ce défi peut être surmonté grâce à l’apprentissage par transfert, par lequel un modèle d’IA est formé sur des données provenant d’autres contextes, puis appliqué à la région d’intérêt.

De la même manière, l’étude de Wong et de ses collègues (résumé ci-dessus) a utilisé des images satellite synthétiques pour renforcer le volume des données de formation du modèle.

De telles approches pourraient contribuer à démocratiser la valeur de l’imagerie satellite pour la recherche en santé. Cependant, un réglage fin local des modèles pourrait encore être nécessaire pour valider le caractère généralisable des modèles à de nouvelles régions. Des politiques de santé qui prônent l’infrastructure et la main-d’œuvre nécessaires pour soutenir ces validations seraient les bienvenues. En outre, une stratégie internationale est nécessaire pour garantir que les informations capturées dans les images satellite ne violent pas le droit des individus à la vie privée.

L’IA peut accélérer l’analyse des images satellites, qui, combinées aux données de santé, peuvent contribuer à la réponse aux épidémies de maladies infectieuses et aux mesures de prévention, et fournir des informations sur la prévalence des maladies non transmissibles.

Mais pour avoir une valeur mondiale, il faut des ressources suffisantes pour collecter et analyser les données, ainsi que des principes d’orientation éthique clairs.

La suppression de ces obstacles pourrait ouvrir une voie passionnante et "céleste" vers une meilleure santé.

6 novembre 2024