Quels graphiques mesurent le mieux la pandémie?

La dynamique d’une épidémie n’est pas déterminée par le nombre de jours depuis le début de l’éclosion: c’est plutôt le nombre de personnes infectées qui dicte le nombre de nouveaux cas.
Photo: Dimitar Dilkoff Agence France-Presse La dynamique d’une épidémie n’est pas déterminée par le nombre de jours depuis le début de l’éclosion: c’est plutôt le nombre de personnes infectées qui dicte le nombre de nouveaux cas.

Pour comprendre l'ampleur de la pandémie, doit-on porter notre regard sur le nombre de cas ou le nombre d'hospitalisations? Le nombre de cas total par pays ou par million d’habitants? Avec une échelle logarithmique ou linéaire? Le Devoir vous propose un survol en graphiques, avec le regard d'experts sur la question.


Comment mesurer l’évolution de la pandémie?
  
Ce graphique présente le nombre de nouveaux cas apparus dans les sept derniers jours (axe vertical) en fonction du nombre total de cas (axe horizontal) dans quelques pays du monde. Les deux axes utilisent une échelle logarithmique. Le point représente la situation en date de jeudi, et la courbe son évolution des dernières semaines.

La dynamique d’une épidémie n’est pas déterminée par le nombre de jours depuis le début de l’éclosion : c’est plutôt le nombre de personnes infectées qui dicte le nombre de nouveaux cas (du moins, au début de l’éclosion). Cette relation est déterminée par des paramètres propres au virus (durée d’incubation, durée de la contagion, etc.) qui ne varient pas d’un pays à l’autre. Ainsi, utiliser le nombre total de cas comme variable indépendante (axe horizontal) permet de rendre compte de l’évolution de l’épidémie indépendamment du cadre temporel.

« Ce graphique sert à montrer la similarité de la progression de l’épidémie [lors de sa phase initiale] dans différents pays », explique Pier-André Bouchard St-Amant, professeur à l’École nationale d’administration publique, qui suit de près la flambée de coronavirus au Québec.

Seules des mesures très musclées comme celles mises en place en Chine et en Corée du Sud, ou encore l’épuisement du bassin de personnes à infecter peuvent mettre un terme à la phase exponentielle de la contagion.

Cependant, ce graphique ne permet pas d’observer en détail la sortie de la phase exponentielle — ou, en d’autres termes, de déceler quels pays arrivent à « aplatir la courbe », note M. Bouchard St-Amant. En effet, sur une échelle doublement logarithmique, les variations dans les taux de croissance sont très peu apparentes.

« Quand et comment se déroule la sortie de cette période de croissance exponentielle ? Est-ce qu’elle est rapide ? Ce sont les questions fondamentales qu’on doit se poser pour évaluer si les mesures mises en place par l’appareil public fonctionnent », dit le mathématicien.

Alexis Riopel


Une échelle linéaire, ou logarithmique ?


L’échelle linéaire relève du sens commun. La position verticale d’un point de la courbe est directement proportionnelle à la valeur qu’on veut représenter. Pour tracer la dégringolade hebdomadaire de la Bourse, le nombre d’enfants dans une école ou les fluctuations dans une population de caribous, c’est un choix tout à fait adéquat.

Les épidémies ont toutefois un comportement intrinsèquement exponentiel. Si chaque personne en infecte deux autres, et celles-ci deux autres, le nombre de malades croît de manière accélérée : 2, 4, 8, 16, 32, 64, 128, 256, etc. Lorsqu’on trace une telle courbe sur une échelle linéaire, il devient impossible de lire intelligemment le début de la courbe, et on peut seulement se contenter de contempler la progression d’une courbe qui grimpe vers le ciel comme une fusée (figure du haut).
 

L’option de tracer la courbe sur une échelle logarithmique devient alors intéressante. Dans une telle représentation, la position verticale d’un point de la courbe n’est pas directement proportionnelle à sa valeur. Plutôt, pour chaque incrément dans la position verticale du point (1, 2, 3, etc.), on décuple la valeur représentée (1, 10, 100, etc.). Ce type d’échelle correspond au comportement naturel d’une épidémie (et, il va sans dire, d’une pandémie). Quand une courbe prend l’allure d’une ligne droite sur un graphique logarithmique (figure du bas), c’est que la valeur représentée suit une progression exponentielle. « C’est l’avantage du graphique logarithmique : la pente de la courbe donne le taux de croissance », explique Jacques Bélair, un mathématicien de l’Université de Montréal qui a modélisé la transmission du virus à Wuhan.

L’échelle logarithmique permet ainsi de vérifier si les mesures en place permettent de réduire le taux de croissance du nombre de cas. Par exemple, si le confinement fait en sorte que chaque malade infecte en moyenne 1,5 personne plutôt que 2,5 personnes, cela va rapidement provoquer une inflexion de la droite. Sur une échelle linéaire, la courbe pourrait donner l’impression de croître à toute vitesse dans les deux cas.

Alexis Riopel

 
Le nombre de cas total par pays, ou par million d’habitants?


En date de jeudi, la Chine et l’Allemagne avaient environ le même nombre de cas confirmés de COVID-19 (un peu plus de 80 000) au sein de leur population. Pourtant, la population de la Chine (1,4 milliard d’habitants) est environ 17 fois plus grande que celle de l’Allemagne (83 millions). Faut-il considérer le nombre total de cas dans un pays, ou bien diviser celui-ci par le nombre d’habitants ?

« C’est toujours bon de normaliser, répond Cécile Tremblay, professeure à l’Université de Montréal et médecin microbiologiste et infectiologue au CHUM. C’est plus strict et c’est meilleur comme façon de présenter les chiffres. Sinon, on compare des pommes et des oranges. » Le mathématicien et professeur à l’École nationale d’administration publique Pier-André Bouchard St-Amand abonde dans le même sens, mais soulève une nuance : « La capacité d’un système de santé se mesure en nombre de lits, et non par lits par 100 000 habitants. » Lorsque l’auteur d’un graphique choisit une représentation pour illustrer des données, celui-ci doit savoir quelle idée il veut communiquer, ajoute-t-il.
 

Par ailleurs, le pays n’est pas nécessairement l’unité géographique la plus appropriée. À mesure que les gouvernements restreignent les déplacements, différents bassins de population s’isolent. Ainsi, il peut être avisé de considérer de plus petits découpages géographiques, comme des régions métropolitaines, pour ensuite suivre la proportion de la population infectée à l’intérieur de chacune de ces zones — dont le sort est beaucoup influencé par les tout premiers cas.

« L’épidémie au Canada est partie de voyageurs, ce sont des étincelles, illustre Benoît Mâsse, professeur à l’École de santé publique de l’Université de Montréal. Mais si ton étincelle tombe au milieu d’un lac, tu t’en sors. Si elle tombe dans une forêt sèche, le feu prend rapidement. »

Alexis Riopel et Magdaline Boutros


Le nombre d’hospitalisations, ou le nombre de cas ?


Selon Benoît Mâsse, professeur à l’École de santé publique de l’Université de Montréal, observer la variation du nombre d’hospitalisations et celle du nombre de décès permet de poser un regard plus juste sur l’évolution de l’épidémie. « Le nombre de cas détectés, ce n’est pas un bon reflet de la réalité, puisque c’est certain qu’il y a pas mal plus de personnes infectées dans la population que ce que révèle cet indicateur », fait remarquer le chercheur. De nombreuses personnes qui ont contracté la COVID-19 sont asymptomatiques et ne se font donc pas dépister. Le nombre de cas détectés dépend également grandement des efforts déployés par les autorités pour détecter des cas dans la population.
 

Le nombre d’hospitalisations et le nombre de décès sont des indicateurs plus fiables, relève Benoît Mâsse, mais qui impliquent un décalage de quelques semaines. « Les personnes qui décèdent maintenant ou qui sont actuellement hospitalisées ont été infectées il y a deux ou trois semaines. » Le Canada n’est encore qu’au début de l’épidémie. On voit bien sûr une progression exponentielle au pays, mais celle-ci est tout de même moins prononcée que ce que révèlent les courbes d’autres pays, notamment européens.

Les enseignements tirés de ces pays reflétant notre futur permettent d’affirmer qu’après avoir atteint le fameux pic, il faudra être patient et maintenir notre vigilance. « La pente ne descendra pas à la même vitesse qu’elle est montée », prévient Benoît Mâsse. Et une deuxième vague de contamination est attendue à l’automne. « Mais ça laissera le temps à des avancées scientifiques d’arriver », ajoute le chercheur, citant notamment des tests de dépistage rapide et des tests sérologiques permettant de déterminer qui a contracté le virus, des personnes qui seraient donc immunisées. Le plein de matériel médical pourra également être effectué et des médicaments antiviraux pourraient faire leur apparition, ce qui pourrait faire infléchir le nombre d’hospitalisations et de décès.

Magdaline Boutros

8 commentaires
  • Vincent Fortin - Abonné 4 avril 2020 06 h 19

    Source du premier graphique?

    Bonjour,

    Je suis depuis plusieurs jours l'évolution de la pandémie au Québec en utilisant la première représentation graphique proposée dans votre article:
    https://twitter.com/Vincent79679694/status/1246146398329933831?s=19

    Contrairement à ce que votre expert explique, cette représentation permet facilement d'estimer graphiquement le taux de croissance de l'épidémie pendant sa phase exponentielle (en évaluant l'ordonnée à l'origine de la droite) et de détecter les changements de celui-ci. C'est cependant très difficile quand plusieurs courbes se superposent.

    J'aimerais obtenir les données sous-jacentes, mais malheureusement je ne trouve pas dans l'article la source que vous avez utilisée pour vos données. Est-ce possible d'ajouter cette information?

    Merci,

    Vincent Fortin

    • Claude Coulombe - Abonné 5 avril 2020 16 h 55

      Une excellente source en données libres et en format .csv (comma separated value) est le site de dépôt de données ouvertes du COVID-19 de la Johns Hopkins University

      https://github.com/CSSEGISandData/COVID-19

  • Sylvain Aubry - Abonné 4 avril 2020 06 h 59

    Fameuses statistiques

    Très bon article, mes cours de statistique me reviennent peu à peu... Merci ! ne lâchez pas.

  • Michel Cournoyer - Abonné 4 avril 2020 10 h 28

    Bravo au Devoir

    Je suis fier d'être abonné!

    Est-ce vous qui allez donner la conférence mardi ?

  • André Leclerc - Abonné 4 avril 2020 10 h 45

    L'utilité des graphiques

    Mon opinion, mais je ne suis pas spécialiste, est que le graphique sur des échelles doublement logarithmiques donne une bonne appréciation du caractère commun de l’évolution selon le taux de reproduction de base (le R0) mais qu’il a ses limites sur la compréhension des phases. La sortie de la courbe logarithmique ne veut pas dire grand-chose à part le moment où elle se produit en termes de cas mais ne donne aucune idée sur l’échelle de temps.
    Une courbe en « S » (échelles linéaires) donne une meilleure idée sur le nombre de cas répertoriés ou sur le nombre de décès (2 courbes différentes). La première est fonction du nombre de tests, donc il faut aussi l’accompagner de cette information. Le nombre de décès est intéressant sur une échelle par 100,000 ou million d’habitants d’une population. Peu importe la méthodologie de tests des cas positifs ou sa fréquence, c’est possiblement la seule variable indépendante. C’est cette mesure que l’on retrouve dans l’étude de 2014 sur la grippe de 1918 qui compare par exemple l’efficacité des mesures de mitigation entre Philadelphie et St-Louis (Richard J. Hatchett, Carter E. Mecher, and Marc Lipsitch, « Public health interventions and epidemic intensity during the 1918 influenza pandemic », PNAS, ).
    Le nombre d’hospitalisation ou de cas dans les USI peut aussi être intéressant lorsqu’il s’agit de comparer les administrations entre elles.
    Le compte rendu quotidien du nombre de cas positifs sans rapport au nombre de résultats obtenus dans cette période de 24 heures peut aussi conduire à une mauvaise interprétation. Le ratio entre le nombre de cas positifs et le nombre total de résultats (positifs et négatifs) montre d’ailleurs une variabilité (dispersion) qui diminue avec le nombre de résultats en 24 heures.
    Mais il faut aussi que les méthodologies de mesure soient les mêmes. On voit les différences d’évaluation entre le Québec et l’Ontario en raison d’un taux de test différent, et souvent en raison du backlog dans les résultat

  • Denis Drapeau - Abonné 4 avril 2020 12 h 13

    Texte bien vulgarisé, merci.