Une opinion de Michel Vanden Abeele, ancien directeur général d'Eurostat.

L’erreur est inhérente aux statistiques. La prudence est de mise lorsqu’on examine ces données. Il faut se poser la question de l’honnêteté, de la rigueur, de l’origine et de la véracité des sources.

Il règne une certaine confusion lorsqu’on utilise le terme "statistique". Surtout en ces moments où l’on tente de trouver une explication à un phénomène nouveau, inconnu et créateur d’angoisse.

La statistique peut concerner l’observation de données physiques, mesurables ou reproductibles qui permettent la vérification d’hypothèses. Elle est un élément essentiel de la méthode scientifique.

Une autre acception du terme "statistique" concerne tout ce qui concerne les activités humaines, la société, l’État. Il s’agit d’une activité - une science disent certains - fondée sur le dénombrement ou le regroupement de faits nombreux : la natalité, la mortalité, le nombre d’accidents ou de malades. À partir de séries statistiques établies selon des méthodes précises et documentées, il est possible d’établir des tableaux complexes, des représentations graphiques voire des modèles mathématiques permettant, grâce aux méthodes de calcul de probabilité, d’établir des prévisions ou des présomptions. La statistique devient alors un outil de gestion, par exemple pour les assureurs ou pour aider la décision publique.

Origines

Il n’est pas étonnant que les premières statistiques - les recensements - aient été commandées par le Prince pour compter, connaître et contrôler la population de son État. En Mésopotamie, les Sumériens, dès l’invention de l’écriture établissent des inventaires relevant les activités commerciales de la population. En Égypte ancienne, l’écriture hiéroglyphique rend possible l’établissement des inventaires des produits et des populations sur lesquels étaient perçues les taxes. Dans la Bible, Joseph et Marie doivent se rendre à Bethléem pour répondre au prescrit romain en matière de recensement qui impose le comptage au lieu d’origine. Imaginez les mouvements de population si une telle méthode était toujours appliquée !

Données incomplètes

Actuellement, les données démographiques sont établies sur d’autres méthodes basées, en Belgique par exemple, sur les déclarations à l’état civil dans les communes, depuis que l’on a abandonné le recensement par enquête individuelle des ménages. Mais ces données sont incertaines, mouvantes ou incomplètes : comment sont répertoriés les SDF, les non-résidents, les étrangers non enregistrés ? Si bien qu’il est impossible de préciser le nombre de personnes qui se trouvent à un moment donné sur le territoire d’un pays comme la Belgique. Que dire alors de pays sans administration ou en guerre ? Dans l’Union européenne on connaît ainsi mieux le nombre de vaches que d’Européens ; depuis la crise de la vache folle tout le bétail est muni - en principe - d’une fiche plastique d’identification attachée à l’oreille depuis sa naissance pour des raisons sanitaires ou pour le calcul des subsides agricoles. Il est heureux que les technocrates n’aient pas encore eu cette idée pour compter les bébés en Europe !

Tout questionnaire, tout fichage, ne supprime pas l’erreur ou la fraude. Qui peut jurer n’avoir pas été imprécis, n’avoir oublié volontairement ou non de répondre exactement aux formulaires administratifs, voire de dissimuler certains chiffres, notamment en matière fiscale. La dissimulation de la vérité, le mensonge volontaire ou par omission pollue toute la chaîne d’information et les bases de données. Les séries statistiques ne mentent pas ; elles sont inertes. C’est la cueillette de l’information qui est face à l’erreur ou au mensonge.

Les sciences de l’aléatoire

Donc l’erreur est inhérente à toute donnée statistique. Les statisticiens eux-mêmes le concèdent et ont mis tout un appareil mathématique complexe pour expliquer le degré de fiabilité des données publiées et se mettre à l’abri des interprétations abusives ou biaisées. Il s’est développé ainsi une science statistique faite de doutes et des clauses de prudence d’autant plus nécessaires que l’on s’éloigne de la simple arithmétique faite d’additions, de multiplications ou de pourcentages pour aller vers le calcul des probabilités. L’utilisation de données pour la prévision conduit aux sciences de l’aléatoire dont on perçoit l’utilité pour nombre de domaines comme la physique, l’économie, la gestion des entreprises et surtout maintenant la médecine. Mais on sait également la limite de toute modélisation, surtout dans les sciences humaines.

Vérifier et sourcer

La prudence est de mise lorsqu’on examine toute donnée statistique. Il faut se poser la question de l’honnêteté, de la rigueur, de l’origine et de la véracité des sources. Cela d’autant plus que l’on cite des données complexes qui seront reprises dans les médias. Les agrégats statistiques sont utiles pour les comparaisons mais doivent faire l’objet de vérifications comme cela se fait pour les chiffres fournis à Eurostat par les États membres de l’Union européenne. Il n’est pas rare que surviennent des cas qui doivent être confrontés à l’expertise de comités composés de statisticiens désignés par les États membres avant leur publication par Eurostat. Il en a été ainsi pour le "mirage statistique" survenu en Irlande lorsque le Produit intérieur brut déclaré de ce pays a augmenté de quelque 26 % en 2015. Il s’agissait en réalité d’un phénomène de relocalisation pour des raisons fiscales de plusieurs firmes multinationales dans le domaine pharmaceutique ou de l’informatique dont les actifs productifs ou les royalties sur les brevets sont désormais comptabilisés en Irlande sans pour autant que les Irlandais soient devenus subitement plus riches. Il en a été de même quand la Commission européenne a procédé aux corrections des chiffres fournis par la Grèce en matière de déficit public qui est passé de 1,7 % en 2003 à 4,6 % après correction ou tromperie délibérées sur la surévaluation des ressources fiscales, la mauvaise comptabilisation des transferts financiers européens ou des erreurs dans l’amortissement des dépenses militaires.

Ces exemples montrent qu’il ne faut pas accorder une confiance totale aux chiffres, même lorsqu’ils sont fournis par des États ou des organismes officiels internationaux.

Il existe une mythologie du chiffre. Quoi de plus sérieux qu’un article illustré d’une batterie de chiffres accompagnés de tableaux et de graphiques, supportés par des "études d’experts" ? En tout cas, il faut garder l’esprit critique. D’abord, d’où viennent les chiffres, qui les a récoltés, pour qui et comment ? Quels sont ces experts, leurs intérêts et leur financement ? Ces questions devraient être à la base de tout esprit critique dont on sait que c’est une qualité fort peu commune.

L’argumentation politique se nourrit de chiffres. La prétendue neutralité du chiffre renvoie à l’autorité scientifique. Peut-on concevoir un débat sur la politique sanitaire sans chiffres et sans comparaison de données internationales dont personne ne peut justifier l’exactitude ? Le chiffre fait désormais argument d’autorité surtout s’il est cité par un "expert" dont personne ne peut juger du sérieux. Au cours du débat, on fera référence à un autre "expert" qui, lui, citera d’autres chiffres, tout aussi incertains…

Il est bon, à ce propos, de citer Churchill : "Je ne crois aux statistiques que lorsque je les ai moi-même falsifiées."

Titre, chapô et intertitres sont de la rédaction. Titre original : "Statistiques, erreurs et mensonges".