Les données, le nerf de la guerre de la transformation vers l’intelligence artificielle: tour d'horizon avec Jonathan Gaudreault
Vous découvrirez ici une brève entrevue avec notre chercheur membre, Jonathan Gaudreault, de la Faculté des sciences et de génie de l’Université Laval. Au programme: tour d’horizon de défis et enjeux associés à l’usage des données dans le contexte de projets industriels, et des façons de les surmonter identifiés au fil de divers projets de recherche et collaboration université-industrie.
On s’en doute bien : le nerf de la guerre, pour développer des projets d’intelligence artificielle (IA) en industrie, ce sont les données.
Évidemment, ces données-là, il faut les avoir en main. «Bien souvent, on se lance pensant que ça sera facile, que les données, on les a. Une fois confronté au test de la réalité, on réalise que de les récupérer, les concilier sera tout sauf facile! Et si le travail n’est pas bien fait, une fois rendu à développer des modèles d’apprentissage, on va rapidement se buter à un mur… et devoir retourner en arrière!», lance Jonathan Gaudreault, directeur du Consortium de recherche en ingénierie des systèmes industriels 4.0.
Le chercheur, qui figurera à la programmation 2022 du Rendez-vous IA Québec, mène de front des projets d’applications industrielles depuis des années, avec de grandes et petites entreprises québécoises. Il le sait : travailler avec des données industrielles représente de nombreux défis.
«D’entrée de jeu, il faut éviter de se mettre la tête dans le sable et accepter que le projet de transformation vers le 4.0, vers l’IA, ça commence avec un questionnement face aux données, ça commence par un nettoyage des données… Et, qu’on le veuille ou non, il faudra probablement y mettre 80% de son énergie!»
Six problèmes classiques en lien avec l’usage des données
En fait, le chercheur identifie six problèmes « classiques » liées aux jeux de données en entreprise.
Lesquels?
D’entrée de jeu : la question de la cohérence, entre des données qui proviennent de différentes sources, de différents projets.
Puis, vient la fiabilité – « Certaines données sont absentes, ou contiennent des erreurs – bref, il y a un enjeu quant à la qualité de nos données ». Ou, alternativement, si les données sont bonnes, elles peuvent aussi faire abstention d’un enjeu important, rendant leur usage limité ou impossible. « Sans compter les données non-représentatives, qui peuvent fausser le portrait qu’on veut dresser! Ou encore des données dont on ignore l’importance, et qu’on n’a tout simplement pas », poursuit le professeur à la Faculté des sciences et de génie de l’Université Laval.
Sinon, on doit aussi considérer les questions d’accès ou de sécurité : « Où se trouvent les données? Est-ce que c’est dans la tête d’un des gestionnaires de l’entreprise, dans des fichiers manuscrits ou dans un système fermé? Y-a-t-il des enjeux d’accès ou de permissions pour en faire usage? Autant de situation qui rendent difficile leur usage! », indique Jonathan Gaudreault.
Bref, autant d’écueils sur lesquels peuvent, rapidement, se frapper des projets liés à l’usage des données – comme l’intégration d’algorithmes d’IA.
Prendre un recul avant de plonger
« On a tendance à croire que la donnée est bonne… jusqu’à preuve du contraire! C’est pour ça qu’avant de se lancer dans un projet qui implique les données, il importe de prendre un pas de recul, de se questionner sur elles, de se demander ce qu’on a fait pour valider leur qualité, leur intérêt », fait valoir M. Gaudreault.
A-t-on identifié un responsable de leur qualité?
S’est-on assuré qu’elles sont utilisables pour répondre aux questions ou enjeux qu’on a ciblé? Ou encore en mesure d’être comparées entre elles?
Sont-elles issues de données manuscrites, illisibles?
Bref, avant de se lancer, on a tout avantage à dresser un état des lieux… « Et savoir profiter des problèmes rencontrés pour inventer de nouvelles solutions! Après tout : il y a toujours des retombées positives inattendu à ce qui semble a priori représenter un problème », ajoute le professeur Gaudreault.
Partir avec un avantage
Si jamais ces préoccupations rendent frileux le gestionnaire, le chercheur propose deux solutions qui peuvent aider l’entreprise à se lancer.
La première? Créer un poste de « Chief Data Officer » au sein de l’organisation. La seconde? « L’entreprise peut avoir avantage à mettre en place plusieurs petits projets basés sur les données – ne serait-ce que des tableaux de bord, de façon à détecter les problèmes potentiel en amont, plutôt que de se préparer uniquement avec la vision d’un mégaprojet à moyen ou long terme. »
Le Rendez-vous en intelligence artificielle de Québec est présenté dans le cadre de la 6e Semaine numériQc, les 4, 5 et 6 avril 2022
Restons en contact!
Vous souhaitez être informé des nouvelles et activités de l'IID? Abonnez-vous dès maintenant à notre infolettre mensuelle.