dimanche 17 août 2014

Progression de la maladie en 2014



mise à jour du 30 Octobre
Comptage du 23 Octobre

Cette page est remise à jour pour chaque publication de l'OMS.

1. Introduction

Les données utilisées dans ce blog proviennent de l'OMS (ou World Health Organization - WHO) à partir de la version anglaise du site de l'OMS généralement à travers la collation et les calculs effectués par le rédacteur de la Version Anglaise du Site Wikipédia consacré à cette épidémie. Quelques séries de données ont été fournies par David Rabel que je remercie (voir le forum ci-dessous). 

Ce blog a pour objectif d'utiliser les données de l'OMS pour essayer de modéliser mathématiquement la progression de la maladie. Toutefois cette modélisation devient de plus en plus difficile car les données de l'OMS deviennent elles-mêmes de plus en plus imprécises. Ainsi les documents publiés par l'OMS laissent entendre que les chiffres peuvent être rectifiés rétroactivement. Ce phénomène s'est déjà produit et je tiens compte évidemment des nouvelles données. Pour être tout à fait clair, après avoir testé plusieurs méthodes, je reprends ici les données de l'article du site Wikipedia en anglais si je ne dispose pas du rapport de l'OMS. J'ai en effet pu vérifier à plusieurs reprises que son auteur est extrêmement méticuleux sur le comptage. J'invite d'ailleurs les lecteurs de mon blog qui souhaitent avoir plus de détails par pays ou des liens sur des articles d'intérêt (en anglais) d'aller visiter son site

Des résultats ont été publiés pour les dates du 24 et du 27 Octobre qui peuvent être consultés sur le site Wikipédia. Cependant il semble que ces résultats s'accordent peu avec ceux qui ont été publiés jusqu'à maintenant. J'ai donc délibérément préféré attendre le dimanche 2 novembre pour effectuer mes calculs avec les toutes dernières valeurs.

2. Résultats au 23 Octobre 2014

Le Tableau 1 ci-dessous contient les 15 dernières données publiées portant sur le nombre de cas et le nombre de morts tous deux cumulés depuis le début de la maladie (la date est celle pour laquelle le décompte est arrêté avec l'imprécision relevée dans le premier paragraphe).

Tableau 1. Progression de la maladie

A la date du 23 Octobre, l'OMS recense 10141 cas et 4922 morts. Le ratio nombre de morts sur nombre de cas s'établit à environ 50% : la moitié des personnes touchées par l'épidémie décèdent. 

Cependant, cette valeur doit être interprétée comme la mortalité minimum. En effet, à une date donnée, le nombre de morts à cette date ne représente pas la totalité des malades qui vont finalement mourir. Parmi les malades non décédés à cette date, un certain nombre d'entre eux vont encore décéder après l'arrêt du comptage. En effet, une fois qu'une personne a développé les symptômes de la maladie et donc peut être recensée comme "malade", la maladie peut encore mettre de un à dix jours pour se révéler fatale. Finalement si par exemple la moitié de ces personnes malades à une date donnée décèdent après cette date, le taux de décès final sera de l'ordre de 75%, ce qui est d'ailleurs environ le taux annoncé par l'OMS pour l'épidémie d'Ebola.  

Les données du Tableau 1 sont présentées dans le Graphique 1 ci-dessous. L'échelle du nombre de cas/morts est une échelle logarithmique, ce qui signifie qu'une variation linéaire du nombre de morts cumulé (courbe en rouge ci-dessous) est en fait une variation exponentielle. Les droites en pointillée représentent les extrapolations effectuées ci-dessous (voir paragraphe 4, Tableau 5).



Graphique 1. Progression de la maladie et extrapolations

Suivant la méthode de calcul exposé dans le troisième paragraphe, les données du Tableau 1 sont utilisées pour modéliser la progression de la maladie. Cette modélisation permet de calculer la vitesse de la maladie en nombre de cas et en nombre de morts par jour (et les accélérations correspondantes). Elle permet également de calculer au bout de combien de jours, le nombre de cas et le nombre de morts auront été multipliés par deux (temps de doublement). Ces valeurs sont reportées dans le Tableau 2.


Tableau 2. Progression de la maladie
Modélisation

Notons que le nombre de morts journalier se stabilise autours de 96 morts/jour et que le nombre de cas journalier est en décroissance. Ce fléchissement de l'épidémie d'Ebola se traduit également par une augmentation du temps de doublement qui est maintenant de l'ordre de 38 jours au lieu des 30 enregistrés tout le mois de Septembre.

Pour les lecteurs non familiarisés avec une variation exponentielle, je vais essayer de traduire ce que représente une valeur de temps de doublement de 30 jours: Cela signifie que, chaque mois, l'épidémie d'Ebola tue autant de personnes qu'elle n'en a tué depuis le tout début de la maladie. Ainsi par exemple, le nombre de décès était de 467 le 2 Juillet 2014. Environ un mois plus tard il y en avait 932 le 4 Août, puis 2089 le 3 Septembre et enfin 3865 le 5 Octobre. Donc, tout doit être dimensionné de manière à ce que le nombre de médecins, d'infirmier(e)s, de lits, de moyens logistiques de toutes natures doublent au minimum tous les mois.

Le fait que ce temps de doublement augmente régulièrement depuis un mois maintenant est donc très une bonne nouvelle.  

Les données du Tableau 2 sont présentées sous forme graphique ci-dessous (Graphique 2). Pour des raisons de lisibilité je n'ai pas représenté les accélérations. 


Graphique 2. Variation du Temps de doublement du nombre de morts cumulés 
et du nombre de morts journalier

3. Comment ces courbes sont calculées ?

Ainsi que l'on peut le remarquer dans le Graphique 1, les variations du nombre de cas et de morts cumulé suivent une variation linéaire en échelle logarithmique. Ceci laisse donc penser que cette variation peut être modélisée par une loi exponentielle et c'est donc cette loi que l'on essaie de déterminer. Pour cela, les 15 valeurs du Tableau 1 sont utilisées pour effectuer une régression linéaire en échelle logarithmique pour le nombre de cas et le nombre de morts par jour (à l'aide d'Excel). Ceci permet de calculer les coefficients de deux courbes exponentielles qui représente la variation du nombre de cas cumulé depuis le début de la maladie, noté Nc, et celui du nombre de morts cumulé, noté Nm (Cf. Schéma 1). Ces deux équations sont utilisées sous la forme d'une puissance de 10, plus facile à apprécier ( 10 puissance 1 vaut 10, 10 puissance 2 vaut 100, 10 puissance 3 vaut 1000 et ainsi de suite).

Schéma 1. Équations utilisées pour modéliser
les variations du Nombre de Cas et de Morts cumulé 

Dans les équations du schéma 1, J représente le nombre de jour depuis le début de la maladie en prenant la date du 25 Mars 2014 comme origine des temps. Les valeurs des coefficients ajustables de ces deux équations à la date du 23 Octobre 2014 sont reportées dans le Tableau 3 ci-dessous : 

Tableau 3. Valeur des coefficients des équations modèles
d'après les 15 dernières valeurs publiées par l'OMS. 

Ces équations sont utilisées pour calculer la vitesse de l'épidémie en nombre de cas Vc et en nombre de morts Vm par jours (en dérivant les équations précédentes par rapport au temps). Comme la loi est exponentielle, on peut également calculer un temps de doublement, c'est à dire le temps nécessaire pour constater un doublement du nombre de cas Tc ou du nombre de morts Tm cumulé. Plus l'épidémie accélère, plus ce temps est court. Les équations utilisées sont reportées ci-dessous.

Schéma 2. Équations utilisées pour calculer la vitesse
et le temps de doublement de l'épidémie (voir texte) 

Pour évaluer l'aptitude de ces calculs à prévoir l'évolution réelle de l'épidémie d'Ebola, on peut regarder les extrapolations successives réalisées pour la date du 23 Octobre 2014 que cette modélisation a permis d'effectuer. Les valeurs obtenues sont reportées dans le Tableau 4 ci-dessous. 


Tableau 4. Extrapolations pour le 23 Octobre 2014
(*) la date de la première colonne est celle à laquelle l'extrapolation
a été réalisée pour prévoir le nombre de morts cumulé au 23 Octobre 2014.

On voit que l'erreur peut atteindre, voire dépasser 40% pour les extrapolations effectuées un mois à l'avance. Cette valeur de l'erreur à un mois calculée pour le relevé du 23 Octobre ( comme pour les 19, 17 et 14 Octobre ) est de plus en plus élevée, les calculs donnant tout le mois de Septembre de l'ordre de 20% voire moins. Deux interprétations possibles: soit l'épidémie "ralentit", soit le comptage est de plus en plus déficient. C'est comme prendre la température d'un malade et observer que cette température diminue: est-ce parce que le malade est en train de guérir ou parce que le thermomètre est cassé ? Soyons optimistes et souhaitons que le thermomètre continue de fonctionner!

4. En conclusion

L'épidémie peut-être approximativement modélisée par une variation exponentielle du nombre de cas et du nombre de morts cumulés. Suivant ce modèle, le nombre de morts journalier s'établit à environ 96 morts/jour. Le nombre de cas et de morts journalier semble se stabiliser en espérant qu'il ne s'agit pas d'un artefact dû aux difficultés du comptage. 

Le modèle peut être utilisé pour extrapoler l'évolution de l'épidémie dans le futur. Compte tenu des erreurs de plus en plus importante sur ces prévisions, je les donne à titre indicatif mais il est fort probable que les chiffres réels soient nettement plus favorables. Les valeurs obtenues sont reportées dans le tableau 5 ci-dessous.


Tableau 5. Extrapolations pour la période à venir

Au rythme actuel et avec le modèle utilisé, la fin du mois d'Octobre pourrait enregistrer entre 5000 et 8000 morts avec environ 2000 cas nouveaux par semaine. A plus longue échéance, les perspectives sont assez effrayantes quoique moins qu'il y a un mois. Les lecteurs assidus de ce blog se souviennent sans doute qu'au cours du mois de Septembre, les extrapolations donnaient 40000 morts pour la fin de l'année. On n'en serait plus, si j'ose dire, qu'à 18 000. On peut même penser que si le ralentissement se poursuit cette épidémie soit vaincue avant que le cap des 10 000 morts soit atteint. Evidemment, il est encore trop tôt pour crier victoire. De plus Etant donné qu'il y a plus de 10000 cas recensés et que le taux de mortalité est aux environ de 70%, cela signifie que l'on sait déjà qu'il y a aura au moins 7000 morts avant la fin de l'épidémie soit 2000 de plus qu'aujourd'hui.