Une chronique "Science étonnante" de Fabrizio Bucella, physicien, docteur en sciences et professeur à l’ULB, dont les livres, qui allient sciences et pédagogie, sont publiés aux éditions Dunod (Paris). Une fois par mois, il nous propose une chronique de vulgarisation scientifique où sont mis en avant des découvertes et des débats scientifiques qui sortent de l’ordinaire.

Pensez aux derniers sondages : ils ont été présentés avec des chiffres précis. Tel parti politique est crédité d’autant de votes préférentiels, tel homme politique récolte autant de voix…

Le souci est qu’on utilise un échantillon pour estimer une valeur sur l’ensemble de la population. En vérité, il faudrait travailler avec des intervalles de confiance. Ceux-ci donnent, à partir de l’échantillon, une fourchette dans laquelle se trouve la variable estimée. Avouons que c’est plus machineux et qu’on risquerait de perdre des lecteurs, et les instituts de sondages, des commanditaires.

Élargir la fourchette ?

Ceci étant, même en présentant les choses avec des intervalles de confiance, on fait fi d’une réalité sous-jacente : quelle est la probabilité que la véritable valeur se trouve justement dans la fourchette présentée ? Les statisticiens parlent d’un intervalle de confiance à 95 %. Cela signifie qu’il y a 95 % pour cent de chances que la véritable valeur soit dans la fourchette. Il reste 5 % de chances qu’elle ne s’y trouve pas. C’est très grand, ce 1 sur 20. Si on vous disait qu’en traversant la rue, vous auriez 1 chance sur 20 de vous faire renverser par une automobile, vous resteriez sur le trottoir et feriez le tour du pâté de maisons.

On peut faire mieux et diminuer le risque d’erreur : on abaisse la chance que l’intervalle de confiance se plante mais, en retour, il faut augmenter la taille dudit intervalle. La probabilité de tomber juste sera, par exemple, de 99 %, et l’intervalle sera agrandi en proportion.

Bref, on se trouve à la fois avec une fourchette et avec un pourcentage qui exprime la chance d’être pile-poil dans la fourchette. Certes, tout ceci n’est pas en tant que tel bien complexe, mais il y a comme une hésitation. Autant on accepte facilement la fourchette, autant on ne voudrait pas se coltiner en sus un risque de ne pas s’y trouver. Cette gêne est d’un ressort plus général : on n’aime pas trop qu’on nous présente les choses en termes de probabilités.

Le coup du parapluie

Prenons un exemple simple de la vie de tous les jours. De plus en plus de sites météorologiques utilisent la chance dans leur présentation : "Risque de pluie estimé à 30 %". Que faites-vous ? Comme on l’a vu, puisqu’on n’aime pas les présentations de ce type, on va biaiser. Intuitivement, on va fourguer les probabilités sous le tapis. Si le risque de pluie est 30 %, le risque de non-pluie est de 70 %. Logique. On se dit qu’on a plus de chance qu’il ne pleuve pas que l’inverse. Logique (bis). On laisse son parapluie à la maison et le tour est joué.

Sauf que c’est risqué, car en gommant brutalement la probabilité, sur un grand nombre de cas, on se fera rincer trois fois sur dix. Voilà qui est énorme, c’est six fois plus que les fameux 5 % d’erreur de nos sondages, qui nous semblaient déjà beaucoup. Peut-on faire mieux ? Comme de juste, on peut prendre le parapluie d’office, on ne sera jamais pris au dépourvu. On aura bien eu en main notre pépin quand le ciel nous sera tombé sur la tête, mais avouez que ce n’est pas des plus pratiques : on l’aura pris pour rien sept fois sur dix (c’est vraiment beaucoup).

Peut-on faire vraiment mieux ? On voudrait prendre moins inutilement le parapluie que sept fois sur dix (cas où on le prend d’office et qu’il ne pleut pas) et se faire rincer moins souvent que trois fois sur dix (cas où on ne le prend jamais et qu’il pleut). Dans ce cas, une solution est dérivée de la théorie des jeux. Il faut prendre le parapluie avec la même probabilité que la pluie tombe, soit trois fois sur dix. Sur un grand nombre de cas, voici ce qui se passera (avec des petites simplifications sur les pourcentages) :

- sortie sans parapluie et il ne pleut pas : 50 % ;

- sortie sans parapluie et il pleut : 20 % ;

- sortie avec parapluie et il ne pleut pas : 20 % ;

- sortie avec parapluie et il pleut : 10 %.

Et donc, on se ramasse la drache nationale sur le caillou dans 20 % des cas, alors qu’en ne prenant jamais le fichu parapluie, on était à 30 %. On a fait mieux. On voit également qu’on sort avec un pépin inutile dans 20 % des cas, alors qu’en le prenant tout le temps on était à 70 %. On a fait vraiment mieux.

Tout ça est bien joli, mais comment choisir concrètement s'il faut ou pas prendre son parapluie ? Évitons de se dire mentalement "Je dois prendre mon parapluie trois fois sur dix, donc je ne le prends pas, car c'est moins souvent que l'autre option ". Saperlipopette, cela reviendrait encore à mettre la probabilité dans la poubelle. Il faut accepter de se fier au hasard, au vrai hasard.

Les dés sont jetés…

Il y a lieu de tirer un dé à dix faces, en ayant choisi préalablement les options, sans tricher. Par exemple, vous prendrez le parapluie si le dé tombe sur les numéros 1, 2 ou 3 ; et vous ne prendrez rien dans les cas contraires. Il existe également des générateurs de nombres aléatoires sur les tableurs courants et en ligne, même si aucun n’a la beauté d’un tir de dés véritable.

En se fiant au hasard, on maximalise nos sorties avec un riflard, un pépin, un pébroque, tout en évitant de le prendre trop inutilement, voire de ne jamais l’emmener, aucune de ces deux options n’étant vraiment satisfaisante.

Si vous préférez somme toute des probabilités certaines, dites-vous qu'elles sont également capables de vous jouer de drôles de tours. Prenez l'affirmation suivante : " Il y a 100 % de chances que cette chronique contienne au moins une erreur."

Si aucune erreur ne devait être trouvée dans le reste du texte, il n’y a plus qu’à considérer ce paragraphe lui-même comme l’erreur. CQFD.

Mais… Si le paragraphe contient l’erreur, c’est qu’il n’y a pas d’erreur. Paradoxal, n’est-il pas ?

