Menu Close
Modèle simple de transmission. En vert les personnes susceptibles d'être contaminées, en rouge les personnes infectées qui peuvent transmettre le virus, en bleu les personnes guéries. Étienne Pardoux, Author provided

Comprendre les bases des modèles mathématiques des épidémies

Jusqu’où la courbe des infectés et des décès va-t-elle grimper ? Quelle est l’efficacité des mesures de confinement décidées dans la plupart des pays ? Peut-on atteindre l’immunité collective ? Comment mener le déconfinement ? Y aura-t-il une seconde vague ? Qu’est-ce que le taux de reproduction, annoncé lundi soir à 0,6 par le gouvernement, alors qu’il valait 4 avant le confinement ?

Les modèles mathématiques des épidémies donnent des éléments pour répondre à ce type de questions. Je voudrais expliquer ce que les modèles les plus simples nous disent. Des versions plus élaborées permettent de faire des prévisions, lesquelles ont convaincu nos dirigeants politiques de confiner la population, malgré la crise économique qui va en résulter. On verra en particulier le rôle du nombre de reproductions de base R0, qui est le nombre moyen de personnes à qui un infecté transmet la maladie au début de l’épidémie. Sa valeur exacte fait encore débat pour le Covid-19. Mais surtout elle dépend non seulement de la façon dont la maladie se transmet, mais aussi du nombre de contacts que chaque individu a chaque jour. C’est pour faire baisser ce nombre en dessous de 1 (on verra pourquoi ci-dessous) que l’on nous confine. Une vidéo complète cet article pour les plus curieux. Certains des passages soulignés renvoient à une version plus complète (avec plus de mathématiques) de cet article, disponible en ligne.

Un modèle simple pour cerner la situation

Le modèle de Reed-Frost est un des plus vieux modèles mathématiques des épidémies, il date de 1929. Il est très simpliste, mais il permet d’introduire des notions essentielles et d’obtenir une formule mathématique importante. Les individus sont de trois types : S comme susceptible (d’être infecté), I comme infecté et infectieux (capable d’infecter un susceptible), R comme remis ou retiré (soit guéri, soit mort). Dans ce modèle, dit « SIR », le temps est discret (on progresse semaine par semaine, par exemple) ; la population est supposée grande, sa taille est n. Au début, il y a n-1 individus de type S, 1 individu de type I et 0 de type R. Un individu qui est infecté une semaine donnée infectera chaque S avec la probabilité p la semaine suivante, puis guérira (devenant R). L’épidémie se poursuit tant qu’il y a des infectés (que I n’est pas nul), puis elle s’arrête.

Deux remarques : on néglige pour simplifier la phase d’incubation ; on suppose qu’un individu de type R, s’il n’est pas mort (ce qui heureusement est le cas de l’immense majorité des R), est immunisé – en réalité, à ce stade, on ne sait pas encore beaucoup de choses sur l’immunité au Covid-19.

Le nombre de reproductions de base, noté R0, est le nombre moyen de susceptibles qu’un infecté infecte au début de l’épidémie, c’est-à-dire dire « lorsque presque toute la population est susceptible ».

Dans le modèle de Reed–Frost, combien vaut R0 ? Donnons des valeurs à nos deux paramètres. Supposons que n = 1 000, et que p = 0,0025 (soit 0,25 %). Le premier infecté a autour de lui n-1 ≃ n = 1 000 individus susceptibles. Puisqu’il infecte chacun d’eux avec la probabilité p, ce nombre moyen vaut ici R0 = n × p = 2,5.

Il est assez clair que si R0 < 1, il n’y aura pas d’épidémie majeure avec un petit nombre d’infectés initiaux, de même si R0 = 1. Par contre si R0 > 1, un seul infecté initial peut déclencher une épidémie majeure, qui touche une fraction importante de la population.

Quelle fraction de la population totale sera touchée par l’épidémie ?

Une question importante, que se posent beaucoup de gens au vu de la croissance exponentielle du nombre d’individus touchés, et qui nourrit les discussions entre épidémiologistes modélisateurs et responsables politiques, est « quelle fraction de la population totale sera touchée par l’épidémie » ? Si l’on admet qu’une personne guérie est immunisée, il est clair que l’épidémie va s’arrêter tôt ou tard. En outre, tout le monde n’est pas touché. Lorsqu’une fraction de la population est immunisée, dans le modèle de Reed-Frost, pour savoir combien de susceptibles un infecté infecte en moyenne, il faut multiplier p par le nombre S de susceptibles restant, et bien avant que ce nombre ne s’annule, le produit p × S passe en dessous de 1, et alors l’épidémie s’arrête.

Voici ce que donnent 10 000 simulations dans les cas R0 = 0,95, et R0 = 2,5. Lorsque R0 < 1, aucune épidémie majeure n’a lieu. Dans le cas R0 = 2,5, une certaine fraction des simulations (qui ne dépend pas de la taille de la population) n’aboutissent pas à une épidémie majeure, tandis que la proportion d’individus infectés dans le cas d’une épidémie majeure se concentre quand la taille de la population augmente autour d’une certaine valeur (laquelle augmente avec R0, comme le montrent des simulations pour plusieurs valeurs de R0.

La hauteur de chaque barre indique le nombre de simulations produisant la proportion de la population totale qui est infectée, indiquée horizontalement. n est la taille totale de la population. Étienne Pardoux, Author provided

Quelle est la fraction de la population touchée par une épidémie majeure ? Supposons que R0 > 1. Dans la réalité, il y a eu plusieurs infectés initiaux, au moins en Europe de l’Ouest et aux États-Unis, suffisamment pour que l’épidémie majeure soit inévitable. On peut montrer que l’épidémie touche au total une fraction τ de la population, qui pour une grande taille de population, est proche de la solution de l’équation 1-τ = e-R0 × τ. Cette équation a toujours la solution τ= 0, et si R0>1, il y a une autre solution, qui correspond à une épidémie majeure. On a les valeurs numériques suivantes :

pour R0=2, τ=79 % ; pour R0=3, τ=94 % ; pour R0=4, τ=98 % ; et pour R0=5, τ=99 %.

La preuve de ce résultat, dans le cas du modèle de Reed-Frost est assez élémentaire. En fait on peut l’établir dans un cadre plus général, mais avec quand même les trois hypothèses suivantes :

  • Pas d’immunité au départ (naturelle ou par vaccination). Vrai pour le SARS-CoV-2, pas pour la grippe saisonnière. Si la moitié de la population était immunisée, la taille totale serait très réduite !

  • Une communauté homogène, ce qui n’est vrai ni pour le SARS-CoV-2 ni pour aucune maladie. Quelles hétérogénéités sont à prendre en compte dépend de chaque maladie et de son mode de transmission. On considère qu’il faut réduire le nombre d’infectés I d’environ 10 % à 20 % par rapport aux prédictions du modèle homogène.

  • On a supposé que le comportement des individus ne change pas au cours de l’épidémie. Bien sûr les mesures prises par les autorités (fermeture des écoles et des lieux publics, confinement) changent la donne.

On peut tracer la courbe de τ en fonction de R0.

Taille totale de l’épidémie en fonction de R0. Notre modèle est en bleu. Si on prend en compte l’hétérogénéité, en rouge pointillé ; et enfin si la moitié de la population était initialement immunisée, en jaune. Étienne Pardoux, Author provided

Comment réduire R0, le nombre de reproductions de base ? On peut factoriser R0 : R0 = p × c × l, où p est la probabilité de transmission à chaque « contact », c est le nombre de « contacts » par jour et l est la durée de la période d’infection. Alors, les mesures de prévention visent à réduire R0 en réduisant :

  • la probabilité de transmission à chaque « contact » p : masques, lavage des mains ;

  • le nombre de « contacts » par jour c : confinement, éviter les transports publics et les grands rassemblements ;

  • la durée de la période d’infection l : diagnostic rapide, isolation des infectés, traitement efficace (si disponible).

Il n’y aura pas d’épidémie majeure si le nombre de reproductions de base peut être réduit à une valeur inférieure à 1 grâce à diverses mesures. Conclusion : il faudrait des masques pour tout le monde (réduction de p) et tester massivement (réduction de l, comme le montre l’exemple de la Corée).

Si une proportion v de la population est vaccinée, alors R0 est remplacé par Rv = (1-v) R0 (chaque “tentative d’infecter” ne réussit qu’avec la probabilité 1-v) : Rv est inférieur à 1 si v > 1-1/R0. Deux conclusions sur la vaccination (qui n’est malheureusement pas encore disponible pour le Covid-19) : d’une part, si on connaît R0, on connaît la fraction de la population qu’il faut vacciner pour être sûr qu’il n’y aura pas d’épidémie majeure – par exemple, si R0 vaut 2,5, il faut vacciner 60 % de la population, 75 % si R0 vaut 4, 80 % si R0 vaut 5. D’autre part, en se vaccinant, on se protège soi-même, mais surtout on protège les autres.

Observer la courbe de propagation de l’épidémie ne suffit pas pour estimer R0 car le taux de croissance de la courbe dépend de deux facteurs : R0 et le « temps de génération » G, c’est-à-dire la durée entre le moment où l’on est infecté et celui où l’on infecte.

Le taux de croissance croît avec R0, décroît avec G. Il existe des formules qui relient r, R0 et la loi de probabilité de G. Par une méthode de « suivi des contacts » (recherche de qui a infecté qui et quand ; ceci a été pratiqué avec succès aux Contamines en février, pour juguler ce foyer d’épidémie), on peut obtenir des informations sur la loi probabilité de G, d’où, en combinant avec l’estimation de r, on peut estimer R0 !

La dynamique de l’épidémie

Jusqu’ici on a surtout discuté la fraction de la population touchée par l’épidémie. Pour décrire l’évolution de l’épidémie, dans le cas d’une grande population, et partant d’une situation où une toute petite fraction de la population est touchée, on peut utiliser un modèle déterministe SIR, qui s’écrit sous la forme d’un système d’équations différentielles, dont je présente ci-dessous graphiquement quelques solutions représentatives. On voit sur les quatre premières courbes que plus R0 est grand, plus la vague des infectés arrive tôt et monte haut. En outre, la réduction de la hauteur du pic est plus marquée que la réduction de la « taille totale de l’épidémie » (l’aire sous la courbe), lorsque l’on réduit R0, car la courbe s’étale.

Si on part avec R0 = 2,5, puis que l’on applique un confinement au bout de la troisième semaine, l’effet de réduction de la vague est très important, même si le taux de reproduction après confinement reste supérieur à 1. Dans la réalité, on n’observe pas une modification si rapide de la courbe, à la fois parce que le confinement ne se met pas bien en place instantanément, et surtout parce que notre modèle ne prend pas en compte des effets de retard inhérents à l’épidémie (temps de génération G, période d’incubation).

L’évolution du nombre d’infectés. À gauche, sans confinement et pour R0= 3 (en noir), R0= 2,5 (en bleu), R0=2 (en rouge), R0=1,5 (en vert). À droite, R0= 2,5 en noir puis confinement après la 3ᵉ semaine, soit un changement de R0 : R0= 1,5 (en bleu), R0=1 (en rouge), R0=0,85 (en vert). Étienne Pardoux, Author provided

L’épidémie actuelle du Covid-19

Concernant le Covid-19 en France, il y a encore beaucoup d’incertitudes quant à la valeur de R0. Certaines estimations tournent autour de 2,5, d’autres donnent des valeurs plus importantes, entre 3 et 5 ! Il est probable que R0 ne prend pas la même valeur dans des zones peu peuplées, et en région parisienne par exemple où beaucoup de gens se pressent dans les transports en commun. Si le gouvernement n’avait pas pris de mesures fortes, on peut penser qu’entre 60 et 80 % de la population aurait été touchée. Et surtout la vague serait arrivée très vite et serait montée très haut, submergeant le système de santé et augmentant la mortalité.

Ceci ne règle pas le problème de comment sortir du confinement. Une des difficultés est qu’à ce jour on n’a pas une bonne estimation du nombre de personnes en France qui ont été touchées par le virus, c’est-à-dire I(t)+R(t), si t est la date d’aujourd’hui. On sait combien ont eu des symptômes assez sérieux pour se rendre à l’hôpital, mais une des particularités de cette maladie est qu’elle est bénigne et même non décelée dans la majorité des cas. Et on ne connaît pas avec précision la proportion de ces cas. Donc on ne sait pas aujourd’hui quelle fraction de la population est immunisée, information qui sera importante pour la sortie du confinement.

Dès que l’on disposera de tests sérologiques fiables de détection des anticorps, on pourra tester par sondage un certain nombre de Français, pour avoir cette information.

Que se passera-t-il dans deux mois, trois mois, six mois ? Aurons-nous un retour à la normale relativement rapide, comme cela a l’air d’être le cas en Chine ? Au niveau européen ? Au niveau de la planète ? Y aura-t-il des rebonds ? Chacun peut formuler des conjectures, mais je pense que personne, à ce stade, n’a de certitude.

Les épidémies et la recherche mathématique

Les épidémies constituent un champ d’application important des mathématiques. Les événements que nous vivons attirent l’attention du public sur cette branche de la modélisation mathématique, et sont aussi l’occasion pour les spécialistes d’accélérer leurs travaux, pour tenter de répondre à des questions qui conditionnent la survie de dizaines, voire de centaines de milliers de gens. Bien sûr, le plus important est la recherche de médicaments efficaces et d’un vaccin, mais les modèles mathématiques restent indispensables pour les décideurs. Voici quelques-uns des problèmes sur lesquels travaillent les mathématiciens et statisticiens qui s’intéressent aux modèles des épidémies :

  • L’hétérogénéité de la population (maisonnées et lieux de travail, répartition spatiale, les voyages…) et ses effets.

  • Faut-il privilégier les modèles les plus réalistes, ou les plus simples (dont on peut mieux tirer des conclusions) ? Leurs réponses sont-elles très différentes ?

  • Quel est l’effet des diverses mesures préventives ?

  • Que peut-on estimer à partir des données disponibles, et quelles données supplémentaires seraient utiles ?


Je tiens à remercier le Professeur Tran Viet Chi, de l’Université Paris Est Marne-la-Vallée, qui m’a aidé à m’initier en accéléré à l’utilisation du logiciel R pour les simulations, et Aurélien Velleret, doctorant à Aix Marseille Université, qui a créé le dessin qui sert d’illustration à cet article.

Want to write?

Write an article and join a growing community of more than 189,800 academics and researchers from 5,044 institutions.

Register now