Entreprise La vague "Intelligence artificielle" est là et se base sur les données. La collecte de celles-ci est un must pour en être.

Chronique d'Etienne Cuvelier, chargé de cours Ichec à la Brussels Management School.

Les médias bruissent, presque quotidiennement, de nouvelles souvent excitantes mais aussi parfois terrifiantes, à propos de l’intelligence artificielle (IA). Les applications actuelles comprennent des activités aussi diverses que la reconnaissance faciale, la conduite de voitures autonomes ou les diagnostics médicaux. 

Evidemment, les prévisions sont difficiles surtout lorsqu’elles concernent l’avenir, mais il est vraisemblable que l’IA sera le vecteur d’une révolution dont l’impact sera aussi important que celui de la diffusion massive de l’informatique. Et ce changement aura une influence, sur l’économie et donc également sur nos entreprises.

Depuis ses premiers balbutiements dans les années 50, en passant par l’émergence de l’apprentissage automatique (machine learning) dans les années 80 jusqu’aux exploits époustouflants de sa déclinaison actuelle, "l’apprentissage profond" (deep learning), l’IA s’appuie presque systématiquement sur des données existantes. 

Ainsi, par exemple, si l’on veut mettre au point un mécanisme de reconnaissance des espèces canines à partir de photos, il faut posséder un ensemble de clichés avec pour chacun d’eux le nom de l’espèce du chien qui y est représenté. 

C’est ce que l’on appelle un ensemble d’apprentissage. Cet ensemble est utilisé pour paramétrer finement le mécanisme de reconnaissance de l’IA, on dit que l’on "entraîne le modèle". Plus la taille de cet ensemble d’apprentissage sera grande, plus le modèle sera capable de distinguer des situations complexes. En conséquence, on peut dire que la vraie matière première de cette révolution, c’est la donnée, avec sa volumétrie comme paramètre non négligeable. 

Avant qu’un modèle d’IA soit opérationnel, il faut donc que l’on puisse l’entraîner. Et pour mener à bien cet entraînement, il faut avoir collecté préalablement des données. Ces dernières doivent décrire suffisamment finement le phénomène étudié, et doivent être en nombre suffisant par rapport à la tâche d’IA assignée. Avec l’engouement pour le phénomène des big data, la collecte et l’accumulation des données n’est, en général, pas un problème pour les grandes entreprises. Mais qu’en est-il des PME ?

On peut légitimement se demander si cette révolution est véritablement intéressante et à la portée des PME. A long terme, la réponse est clairement affirmative. Pour l’intérêt on peut déjà citer la détection de pannes, l’optimisation de processus ou l’automatisation de tâches comme applications actuellement possibles. 

Pour l’accessibilité, rappelons que pendant les années 60-70 la révolution informatique ne semblait accessible qu’aux grandes structures. Similairement à celle de l’informatique, la révolution IA finira par atteindre la grande majorité des couches de l’économie. Néanmoins, si dans ce genre de changement de paradigme, être un précurseur ne permet pas toujours de "transformer l’essai", être en queue de peloton crée souvent un désavantage concurrentiel. 

Le développement des services IA en ligne et à la demande, permet une démocratisation de l’accès à cette technologie. En outre, la multiplication des formations en data science devrait accroître rapidement le nombre de profils capables de mettre en œuvre des processus IA. Mais quid de la matière première ?

La collecte des données nécessaires à un projet IA peut être un processus long et fastidieux sauf si ces données existent déjà dans l’entreprise. Si l’entreprise a déjà une pratique de suivi informatisé de ses différents processus, le passage à l’utilisation de technologies IA devrait être grandement facilité. 

Ceci signifie qu’une "data evangelisation" est nécessaire : elle doit convaincre les dirigeants de PME que les données de leur entreprise et de ses processus une fois informatisées forment une matière première précieuse qu’il faut absolument thésauriser. 

Et aussi que c’est la valorisation de ces données et leur exploitation via l’IA qui va leur permettre de rester compétitifs quand celle-ci sera devenue incontournable.