Un homme montre comment mettre un masque facial et d'autres vêtements de protection lors d'une visite d'une clinique d'évaluation de la COVID-19 à Montréal, mardi le 10 mars. La Presse Canadienne/Graham Hughes

Prédire la propagation du coronavirus grâce à l’intelligence artificielle

BlueDot, une firme canadienne d’intelligence artificielle, a fait récemment les manchettes après avoir mis en garde contre le nouveau coronavirus quelques jours avant que les Centres pour le contrôle et la prévention des maladies (CDC) et l’Organisation mondiale de la santé (OMS) ne lancent l’alerte.

L’entreprise a eu recours à différentes sources d’information autres que les statistiques officielles sur le nombre de cas signalés.

L’algorithme d’intelligence artificielle de BlueDot, un type de programme informatique qui s’améliore à mesure qu’augmente la quantité de données qu’il traite, réunit des nouvelles dans des dizaines de langues, des rapports de réseaux de suivi de maladies végétales et animales et des données sur les billets d’avion. Il en résulte un algorithme qui simule mieux la propagation des maladies que ceux qui s’appuient sur des données de santé publique et qui arrive à prédire les épidémies. BlueDot utilise sa technologie pour prévoir et suivre les maladies infectieuses pour ses clients des secteurs public et privé.

L’épidémiologie traditionnelle repère où et quand les gens ont contracté une maladie pour découvrir la source de l’épidémie et les populations qui sont les plus à risque. Les systèmes d’IA comme celui de BlueDot modélisent la propagation des maladies afin de prédire l’apparition d’épidémies ainsi que la vitesse et la distance de dissémination. Pendant que les CDC et les laboratoires du monde entier s’affairent à trouver des remèdes contre le nouveau coronavirus, des chercheurs utilisent l’IA pour tenter de prédire où la maladie va se propager et quel sera son impact. Ces deux éléments jouent un rôle clé dans la lutte contre la COVID-19.

L’intelligence artificielle ne constitue toutefois pas une solution miracle. La précision des systèmes d’IA dépend fortement de la quantité et de la qualité des données qu’ils amassent. Et la manière dont ils sont conçus et programmés peut soulever des questions éthiques, ce qui engendre des préoccupations lorsque la technologie touche de larges pans de la population sur un sujet aussi vital que la santé publique.

Les données, au cœur de la question

L’analyse traditionnelle des éclosions de maladies repose sur le lieu de l’apparition de celle-ci, le nombre de cas et la période de temps – où, quoi et quand – pour prévoir les risques de propagation dans un court laps de temps.

Les systèmes d’IA examinent plusieurs types de données, comme les vols à destination et au départ de l’aéroport de Wuhan Tianhe, pour prédire les risques d’épidémie. Painjet/Wikimedia, CC BY-SA

Des travaux récents basés sur l’IA et la science des données ont élargi le « quoi » à davantage de sources de données, ce qui permet de faire des prédictions sur les épidémies. Avec Facebook, Twitter et d’autres médias sociaux et microsites, de plus en plus de données peuvent être associées à un lieu et exploitées pour comprendre un événement tel qu’une épidémie. Ces données peuvent inclure des discussions sur un forum de membres du corps médical concernant des maladies respiratoires inhabituelles et des messages sur des médias sociaux de gens qui se disent malades.

La plupart de ces données sont très peu structurées, ce qui signifie que les ordinateurs ne peuvent pas les comprendre facilement. Elles prennent la forme de nouvelles, de cartes de vol, de messages sur les médias sociaux, d’enregistrements de personnes, de vidéos et d’images. En revanche, les données structurées, telles que le nombre de cas signalés par lieu, sont plus faciles à mettre en tableau et ne nécessitent que peu de prétraitement pour que les ordinateurs puissent les déchiffrer.

On a recours à de nouvelles techniques, comme l’apprentissage profond, pour interpréter les données non structurées. Ces algorithmes utilisent des réseaux de neurones artificiels composés de milliers de petits processeurs interconnectés, un peu comme les neurones du cerveau. Les processeurs sont disposés en couches, et les données sont évaluées à chaque couche pour être rejetées ou transmises à la couche suivante. En faisant circuler les données à travers les couches dans une boucle de rétroaction, un algorithme d’apprentissage profond peut apprendre, par exemple, à reconnaître les chats dans des vidéos YouTube.

Les chercheurs montrent aux algorithmes d’apprentissage profond à comprendre les données non structurées en les entraînant à reconnaître les composantes de certains éléments. Par exemple, ils peuvent programmer un algorithme à reconnaître une tasse en l’entraînant avec des images de divers types d’anses et de bords. Il pourra ainsi reconnaître toutes sortes de tasses, et pas seulement celles qui ont certaines caractéristiques.

L’efficacité d’un modèle d’IA dépend des informations utilisées pour l’entraîner. Si on ne dispose pas d’une quantité suffisante de données, cela risque de fausser les résultats des modèles de suivi des maladies. La qualité est aussi essentielle. Il peut être particulièrement difficile de contrôler la qualité de données non structurées, comme celles issues de l’externalisation ouverte. Les chercheurs doivent filtrer soigneusement les données avant de les introduire dans leurs modèles. C’est peut-être une des raisons pour lesquelles certains chercheurs, y compris ceux de BlueDot, n’ont pas recours aux données des médias sociaux.

Une façon d’évaluer la qualité des données est de vérifier les résultats des modèles d’IA. Les scientifiques doivent comparer les résultats de leurs modèles à ce qui se passe dans le monde réel, un processus appelé validation sur le terrain. Des prédictions inexactes en matière de santé publique, en particulier s’il s’agit de faux positifs, pourraient engendrer une hystérie de masse.

L’IA au service du bien commun

L’IA est très prometteuse pour déterminer où et à quelle vitesse les maladies se propagent. Les scientifiques y ont de plus en plus recours pour prédire la dissémination des maladies. Les chercheurs utilisent également l’IA pour modéliser les déplacements des gens dans les villes, car ce peut être lié à la propagation d’agents pathogènes.

Il est peu probable que l’IA remplace les épidémiologistes et les virologistes dans un avenir proche. Gorodenkoff/Shutterstock

Cependant, l’intelligence artificielle ne remplace pas les épidémiologistes et les virologistes qui combattent la maladie en première ligne. D’ailleurs, BlueDot fait appel à des épidémiologistes pour confirmer les résultats de son algorithme. L’IA est un outil qui permet de fournir des alertes poussées et précises afin de réagir rapidement à une épidémie. L’essentiel est de faire profiter les responsables de la santé publique des capacités de prévision et de projection de l’IA pour les aider à répondre aux épidémies.

Même si tout le reste était parfait et que l’IA était une solution miracle, cette technologie demeurerait confrontée à des défis éthiques. Il faut faire preuve de vigilance devant des phénomènes tels que l’exclusion numérique, la version informatisée de la pratique consistant à refuser des ressources aux populations marginalisées, qui peut influencer les résultats de l’IA. Ainsi, des régions ou des groupes démographiques pourraient être complètement exclus de l’accès aux soins de santé si les données utilisées pour programmer un système d’IA ne les incluaient pas.

Dans le cas des modèles d’IA qui recueillent les données des médias sociaux, l’exclusion numérique peut concerner des populations entières qui ont un accès limité à Internet. Il est possible que ces populations ne publient pas sur les médias sociaux ou ne créent pas les empreintes numériques qu’utilisent de nombreux modèles d’IA. Cela pourrait conduire à des recommandations erronées sur les endroits où l’on a besoin de ressources.

Pendant que des scientifiques conçoivent constamment de nouveaux algorithmes d’IA, certains enjeux fondamentaux comme la compréhension de ce qui se passe à l’intérieur des modèles, la minimisation des faux positifs et la reconnaissance et la résolution des problèmes éthiques ne sont pas maîtrisées et nécessitent davantage de recherche.

L’IA est un outil puissant pour prévoir la propagation des maladies. Cependant, il est peu probable qu’elle remplace complètement la combinaison de statistiques et d’épidémiologie utilisée pour la première fois en 1854 par John Snow lorsqu’il a trouvé la pompe d’une source d’eau londonienne contaminée par le choléra et qu’il en a retiré la poignée.

This article was originally published in English

Want to write?

Write an article and join a growing community of more than 100,200 academics and researchers from 3,206 institutions.

Register now