Qu’est ce que le big data ? Le terme de « big data » a des connotations positives et négatives. Il s’agit des informations qui sont enregistrées dans des banques de données de grande taille. « Il faut savoir que, quoique nous fassions, nous laissons des traces électroniques de nos actions : achats de biens et services, conversations téléphoniques, échanges par mail, réseaux sociaux, transactions bancaires… La plupart de ces flux sont devenus électroniques et disent quelque chose sur nous. Ces traces, ces informations que nous laissons constituent le big data, » explique Toon Van Aagt, fondateur de data.be et lex.be.

L’arrivée des objets connectés va encore accroître cette capacité à collecter des informations. En effet, aujourd’hui, la voiture est déjà connectée : elle envoie sa position par l’intermédiaire du GPS qui est relié à un satellite. Cela permet au GPS de calculer le trafic et de renvoyer ensuite des informations aux usagers sur la situation des embouteillages. Que nous soyons actifs ou passifs, tout devient source de données dans notre société ultra-digitalisée. Dès lors, dès que l’on parle de big data, la notion de vie privée n’est jamais loin.

Il existe trois sources principales de données :

· Le « close data ». Il s’agit de données privées qui sont accessibles de façon restrictive moyennant une entrée exigeant un « login » et un mot de passe. Celui qui gère ces données le fait de façon fermée, privée, avec une protection (secret bancaire, par exemple,...).

· Le « public data ». Il s’agit, par exemple, des données privées que l’on rend publiques en les postant sur les réseaux sociaux. « Il s’agit, en quelque sorte, d’une zone informelle, où l’information est publique mais n’est pas destinée à tout le monde. Elle peut, cependant, être réutilisée sans qu’on le sache en étant relayée ou re-tweetée sur les réseaux sociaux. Sa réutilisation est implicite et on ne sait pas où elle peut se retrouver », prévient Toon Van Aagt.

· L’ « open data ». Historiquement, il s’agissait des flux de données gérés par l’Etat : le montant des taxes prélevées, le budget de l’Etat, les subventions payées, les informations publiées au Moniteur,… L’open data est une philosophie d’ouverture qui permet le partage de la connaissance. « Or, on constate que beaucoup de données qui devraient être publiques ne le sont pas. Prenons l’exemple de certains chiffres sur le département de la justice, du budget global des communes, par exemple. Il faut aussi apprendre à gérer toutes ces informations mises à la disposition du public », ajoute Toon Van Aagt.

Il est possible d’analyser ces flux, de les traiter en les mettant dans des algorithmes. Toutes les grandes organisations disposent de budgets pour enregistrer les données. Ces données constituent une source d’information massive, volumineuse qu’il faut être capable de travailler.

Les sociétés data.be et lex.be ont ainsi développé des moteurs de recherche et des outils qui structurent une partie de ces données publiques sur les entreprises en vue d’en faciliter à la fois l’accès et l’utilisation. Sont ainsi regroupées et triées les données de la Banque Carrefour ou encore les publications au Moniteur. Cet outil permet aux entreprises de mieux cibler leurs clients : adresse et déménagement, pouvoir de signatures ou d’engagement de la société, prononcé de faillite,… Ces nouveaux logiciels apportent donc une valeur ajoutée à ces données publiques en les regroupant et en les traitant. Ces données peuvent ensuite être intégrées dans des logiciels internes de l’entreprise.

La digitalisation grandissante de la société, engendre une forme de démocratisation de l’accès aux données et de leur utilisation. Les enjeux du big data constituent un des défis majeurs de l’avenir de nos sociétés. Il faudra cependant que se mettent en place une éducation et une éthique sur l’utilisation de ces données. Se pose alors la question concernant le sort qui sera réservé à la propriété des données relatives aux objets connectés. Quelle que soit l’origine des données (privée ou publique), il faudra que le débat s’installe sur leur usage ainsi que sur la déontologie et sur le respect de la vie privée.





