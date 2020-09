Vous la voyez cette menaçante et mortelle courbe extrapolée de cas confirmés, montant jusqu'au ciel comme pour y envoyer ad patres autant de victimes innocentes ? Et vous le voyez, ce miraculeux aplatissement du 26/07, fruit de nos durs efforts et sacrifices sous la houlette de nos preux virologues ? Qui pourrait encore douter après cela de la justesse de leur science, comme le soulignent par exemple le Standaard, ou encore Het Belang van Limburg ?

© LLB



Une présentation des chiffres biaisée et malhonnête

Sauf que… ce graphique ne dit en fait rien du tout, et même plutôt le contraire de ce qu’on lui fait dire. Pour au moins 5 raisons :

1) Comme le montre le nombre de cas réellement mesuré (les petits cercles verts et noirs), les valeurs journalières connaissent d’importantes variations, d’amplitude comparable voire supérieure au nombre de cas moyen. Avec un tel bruit statistique, il est tout simplement impossible de faire la moindre extrapolation qui tienne la route (1), à moins de se ménager le droit de dire n’importe quoi. Tout au plus, la moyenne lissée permet-elle d’indiquer une (légère) tendance à la hausse.

2) Effet qui n’est que renforcé par le choix (on le verra discutable) d’une extrapolation d’ordre exponentiel. C’est un effet connu et documenté qu’une extrapolation - en particulier exponentielle - est par nature instable, et tendra rapidement vers un résultat infini ou nul, c’est-à-dire dénué de pertinence.

3) De plus - cela devient trivial tant cela a été souligné - le nombre de cas confirmé total est fortement corrélé au nombre de tests, lui-même variable, ce qui n’est pas pris en compte (2). Ce qui s’ajoute au fait que le nombre de cas est devenu un indicateur peu pertinent de la gravité de l’épidémie dès lors que l’immense majorité des cas est asymptomatique et le nombre d’hospitalisations très faible.

4) Pire encore, si l’on prend au sérieux les données présentées (ce qui est donc au minimum hasardeux), le graphique démontrerait que l'aplatissement de la courbe n'est en rien lié aux mesures gouvernementales. Les décisions les plus significatives prises par le CNS et le "couvre-feu" anversois ne sont entrés en vigueur que le 29 juillet, et n’ont pu produire d’effet mesurable que plusieurs jours plus tard (à supposer qu’ils en aient eu). Or une courbe lissée des cas anversois montrerait une valeur moyenne stable au minimum entre le 20 juillet et le 10 août, et même en deçà de l’intervalle de confiance dès… le 29 juillet.

5) Enfin, et c’est en réalité le plus gros problème de ce graphique, c’est l’hypothèse d’une régression exponentielle. C’est-à-dire en fait précisément ce qui est à démontrer ! Il n’est en effet absolument rien dans les données présentées qui permette de valider cette hypothèse. Choisir arbitrairement le type de courbe applicable vous permet pourtant de "prédire" exactement ce que vous avez envie de prédire. Ce choix ne reflète donc en fait que l’hypothèse (ou le parti pris) de son auteur (2).

Tout et son contraire

Au vu d’éléments aussi faibles, n’importe qui serait en mesure de présenter une conclusion radicalement opposée. Imaginez (par exemple) que vous soyez d’avis que les mesures gouvernementales n’ont eu qu’un effet limité ou nul. Pour vous, ces données ne montrent rien d’autre qu’une stabilisation du nombre de cas autour d’une moyenne de 200 cas par jour avec un bruit statistique élevé. Vous tracerez une ligne horizontale à partir de la valeur moyenne du 26 juillet… et les données mesurées par la suite "valideront" votre hypothèse avec un intervalle de confiance élevé.

Anticipant sans doute cette critique, Steven Van Gucht donne d’ailleurs quelques éléments complémentaires en forme d’aveu pour expliquer l’inflexion un peu trop rapide de la courbe anversoise. Les chiffres de Google mobilité montreraient en effet que sous l’effet de la communication apocalyptique du gouvernement, nous avons modifié nos habitudes et sommes restés en moyenne 2% du temps en plus par jour à la maison à partir du 26 juillet, comparé à la semaine précédente. Oublions donc la bulle de 5 et mesures associées, la deuxième vague et de "nombreuses hospitalisations et décès" (sic) auraient donc été évités parce que le Belge moyen est resté… 10 à 20 minutes plus longtemps chez lui en moyenne.

On a retrouvé le virus francophone !

L’affirmation prête déjà à sourire en soi, mais ce n’est pas le seul aspect remarquable de l’hypothèse. En effet, rester 10 minutes de plus chez soi semble avoir eu un effet miraculeux et immédiat sur la province d’Anvers, sans le moindre temps de latence entre les contaminations et les détections de cas (ce qui illustre bien le probable désir d’y voir une corrélation en réalité inexistante). Plus remarquable encore est l’effet sur la Région bruxelloise : on remarque en effet une augmentation… hum… "exponentielle" du nombre de cas bruxellois… exactement à partir du 26/07. Il semblerait donc que l’Anversois soit contaminé en passant plus de temps à l’extérieur de chez lui, le Bruxellois étant quant à lui contaminé en restant chez lui.

Bart De Wever ne manquera pas je présume cette occasion de souligner que le virus bruxellois est à l’évidence plus pantouflard que le flamand.

Mauvais devoir d'étudiant ou prostitution de la science ?

Peut-être êtes-vous convaincus que ces petites observations et sarcasmes démontrent la vacuité des mesures gouvernementales. Vous auriez tort. Elles ne démontrent qu’une chose, c’est qu’il est rigoureusement impossible de tirer la moindre extrapolation significative des données présentées par Sciensano ce lundi, et certainement pas ce que nos chers virologues experts prétendent y voir. Mon sarcasme a donc la même valeur de preuve scientifique que le docte calcul de Van Gucht : aucune.

Pourtant, il y existe une différence capitale entre cette grinçante analyse et les prétentions des virologues experts. En écrivant ce coup de gueule, je n’engage que moi et ne risque la vie ou la santé de personne. Les pressions exercées par "Marc, Steven, Manu, Erika et consorts" quant à elles, ont abouti à des mesures d’une gravité extrême, un impact humain inouï, des maladies psychiatriques et probablement des suicides, des chutes dans la pauvreté, pour ne pas parler des milliards de conséquences matérielles qui ne sont encore (à mes yeux) qu’un moindre mal. Avant de prendre ou de faire prendre une responsabilité d’une telle ampleur et quand on dispose de moyens scientifiques aussi conséquents que ceux dont dispose Sciensano, est-ce trop demander que de se baser sur des éléments solides et démontrables ? Est-ce trop demander que de se remettre en question si nécessaire ? Est-ce trop demander des excuses si l’on s’est trompé ? Est-ce trop demander qu’un peu de sérieux et d’honnêteté intellectuelle ? Est-ce trop demander d’éviter de miner la confiance de la population en la science en présentant ad urbi et orbi des éléments qui tiennent au mieux du mauvais devoir d’étudiant en Math’ App’ de première bac, au pire de prostitution avérée de la science pour justifier par après la justesse des décisions prises ?

Apparemment oui.

=> (1) Pour être complet, mentionnons que les auteurs du calcul, détaillé plus avant ici, résolvent cette question en supposant une répartition normale des variations observée. Hypothèse qui vaut ce qu’elle vaut et souligne bien l’intérêt purement académique de la régression proposée.

=> (2) Soulignons au passage le commentaire un peu plus nuancé et prudent des auteurs, qui ne se cachent en rien leurs hypothèses malgré leur prétention (au minimum incertaine, au pire erronée) de modéliser la réalité.