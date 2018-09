Depuis la nuit des temps, les humains doivent faire face aux épidémies. Si l’on se réfère à l’époque actuelle, on se rappelle de celle de 2014 où le virus Ebola avait créé une panique générale au sein des populations africaines et provoqué plus de 11 000 décès. Si cette épidémie-là est restée globalement confinée au continent africain, ce type de pathogène peut évidemment se propager à l’échelle mondiale.

H1N1 en est un bon exemple. Le 30 avril 2009, un virus de la grippe originaire de fermes industrielles de l’État du Veracruz au Mexique fait son apparition. D’abord dénommée grippe mexicaine, puis grippe H1N1, ce virus s’est très vite propagé et les autorités se sont trouvées confrontées à une véritable pandémie. Des mesures ont été rapidement imposées, comme la vaccination des plus jeunes et des personnes à risques. Des « tests rapides » (RIDT ou Rapid Influenza Diagnostic Tests) sont apparus sur le marché, permettant de détecter en 15 minutes plusieurs virus de grippe A, dont le H1N1. Les services de santé publique ont également recommandé l’adoption de précautions élémentaires d’hygiène afin d’espérer contrôler la progression du virus.

La grippe sur Google

La propagation mondiale de H1N1 a mis en lumière la difficulté d’arriver à faire de la surveillance épidémiologique à une telle échelle, étape essentielle pour arriver à anticiper les réponses face à ce type de pandémie. Le problème n’est bien sûr pas nouveau, et des solutions ont été déjà envisagées. Probablement la plus innovante est l’utilisation d’Internet en épidémiologie. Chaque jour, des millions de recherches sont effectuées sur les moteurs, notamment sur la recherche de certains symptômes (« fièvre », « douleurs articulaires », etc.). En 2008, Google lançait une application, Google Flu trends, qui permet d’analyser les requêtes saisies dans le moteur de recherche et ainsi de suivre et prédire l’évolution des cas de grippe saisonnière. Crédible au début, le service a surestimé les épidémies de grippe et a depuis été abandonné.

Si les requêtes effectuées sur les moteurs de recherche ne se sont pas révélées être de si bons indicateurs, un autre outil a complètement changé la donne : les réseaux sociaux. Espace d’échange pour des milliards de personnes, le contenu des messages et les différents fils de discussions se sont révélés extrêmement précieux pour détecter rapidement les épidémies, mais également la façon dont elle se propage et même inférer le comportement des populations.

Marcel Salathé, de l’École Polytechnique Fédérale de Lausanne, l’un des précurseurs de « l’épidémiologie digitale », a montré que l’activité épidémique de la pandémie H1N1 reflétait de façon relativement précise l’activité épidémiologique observée par des moyens plus conventionnels. Ainsi, ce type d’analyse, mêlant big data, sociologie et épidémiologie, est extrêmement prometteur dans un contexte d’émergence de maladies infectieuses car il peut servir de nouveau système de surveillance. Il est également possible, grâce à cet outil, de détecter une tendance sur les comportements humains face à une épidémie.

Twitter sociologie

En analysant les données des géants du monde numérique, notamment sur les déplacements d’individus et leurs interactions grâce à des algorithmes sophistiqués de traitement de texte, il devient alors possible de faire une sorte d’enquête sociologique de façon instantanée sur plusieurs milliers d’individus.

C’est ainsi qu’en 2014, nous avons analysé les messages postés sur les comptes Twitter de Martinique où sévissait une épidémie du virus Chikungunya particulièrement importante.

Twitter , CC BY

En traitant les sentiments exprimés dans ces messages grâce à des modèles mathématiques, il nous est apparu que l’épidémie ne pouvait pas s’expliquer uniquement par l’abondance des moustiques (le vecteur de ce virus), mais également par l’état psychologique de la population. En effet, les pics épidémiques étaient synchronisés dans le temps avec l’expression, par les utilisateurs des réseaux sociaux, d’une demande de protection contre les moustiques. De façon intéressante, nous avons également pu noter que les campagnes de communication mise en œuvre tout au long de la période épidémique ont été plus ou moins bien reprises en fonction de la pertinence du message apporté au moment le plus opportun.

Bien évidemment, ce type d’approche est forcément biaisé : toutes les catégories de la population n’utilisent pas les réseaux sociaux. C’est pour cela que nous sommes en train de réaliser une étude comparative, en collaboration avec Santé Publique France, entre les différents messages postés sur Twitter (plus de 160 000 tweets ont été analysés concernant le besoin de protection, les moyens de lutte et la peur occasionnée) et les données sociologiques du baromètre de la santé, un vaste sondage réalisé sur un panel de 15 000 personnes.

Protection des données

Une fois les concordances quantifiées entre les sondages « classiques » et cette approche d’épidémiologie digitale, il sera alors possible de comprendre plus précisément dans quel contexte ce type d’approche peut être utilisé. Il faut également soulever les potentiels problèmes éthiques que pose ce genre d’approches. La plupart des réseaux sociaux offrent de façon gratuite un accès aux contenus des différents messages postés, ce qui peut poser des problèmes de protection des données personnelles.

Si l’émetteur du message est bien évidemment rendu anonyme dans les études scientifiques, cela soulève tout de même des questions d’éthique et d’un contrôle possible par Le Comité national de l’informatique et des libertés (CNIL) qui a pour mission de protéger les données personnelles. Néanmoins, au regard de l’énorme capacité de ce type d’approche, en termes de volume de données et d’instantanéité, il s’agit d’un défi pertinent à relever.