Ce fut la première mission de la datateam de La Libre Eco : analyser en détail les dizaines de milliers de données publiques relatives à la fiabilité de notre chemin de fer national pour l’année 2018, dernière année complète disponible. “Évidemment”, s’était-on enthousiasmé en juin…

Ce qui piqua notre curiosité journalistique, piqua également nos yeux au fur à mesure du développement de ce projet de plusieurs mois de travail ! En fait, la vraie formulation, qui colle plus à la réalité, aurait dû être : “Cela vous dirait de passer des mois à créer des formules Excel et scrapper une tonne de données ?”.

Mais ce projet fut tout d’abord une rencontre. Fin mai, la nouvelle équipe de La Libre Eco était sur pied. Tout de suite, nous avions eu envie d’aller plus loin. On nous assène d’année en année des chiffres globaux de ponctualité. Nous, nous voulions les chiffres en heures de pointe, qui concernent le plus grand nombre. Décoder les données, aller au fond des choses et faire voir la fiabilité du réseau à travers un nouveau prisme. Une mission remplie en scrutant quatorze lignes principales, matins et soirs, dans les deux sens et en analysant pas moins de 452 trains empruntés par des milliers de navetteurs quotidiennement.

© LLE

Ce fut ensuite une histoire de chiffres. 68 000. Chaque jour via la plateforme OpenData d’Infrabel, nous avions accès à un fichier Excel à 68 000 entrées qui recensait quotidiennement les déplacements de chaque train sur le réseau belge. Avant de devenir fou et de fatiguer notre entourage car Excel était devenu notre vie, nous avons eu un petit coup de pouce de “jeunes geeks” réunis autour d’un concours OpenData sur la mobilité. En partie grâce à eux, les chiffres ont pris une valeur de plus en plus significative et notre analyse a pu se poursuivre. Mais leur méthodologie était différente et tous nos calculs ont dû être corrigés pour coller à celle de la SNCB, relative aux retards.

Ce fut, enfin, un sommet à gravir, à redescendre et à gravir à nouveau. Travailler avec les données, c’est travailler avec du matériel sensible. Il faut avancer minutieusement pour éviter toute erreur “technique” et surtout toute interprétation précipitée. On a fait face à des manœuvres kilométriques et répétitives. Mais il a suffi de trouver le bon aiguillage pour démêler un casse-tête chronophage et faire le lien entre tout. Voici les vrais chiffres de ponctualité du rail…