Des travaux de recherche en IA et spectrométrie de masse menés par Arnaud Droit mis de l'avant dans «Nature Communications»
Arnaud Droit (Université Laval) et Frederic Precioso (Université Côte d’Azur) ont conçu une méthode innovante d’intelligence artificielle : l’apprentissage dit cumulatif, qui permet d’apprendre une représentation convolutionnelle de données lorsque l’ensemble d’apprentissage est faible. Les performances de la méthode, et son applicabilité à tout autre domaine ont donné lieu à publication dans la prestigieuse revue Nature Communications en novembre 2020.
Pour évaluer leur méthode et démontrer son potentiel, ils ont collaboré avec une équipe du laboratoire PRISM de l’Université de Lille (U1192 INSERM) qui développe un instrument de spectrométrie de masse pour la détection du cancer. La difficulté d’acquisition des spectres ne permet pas de produire des volumes de données suffisant pour bénéficier de la puissance du deep learning.
Grâce à l’apprentissage cumulatif, de petits nombres de spectres acquis pour différents types de cancer, sur différents organes de différentes espèces, contribuent tous ensembles à l’apprentissage d’une représentation profonde qui permet d’obtenir des résultats inégalés à partir des données disponibles sur la détection des cancers visés.
Les résultats de leur recherche ont donné lieu à publication dans la prestigieuse revue Nature Communications le 5 novembre dernier.
Frédéric Precioso est professeur des Universités au sein du laboratoire Laboratoire d’Informatique, Signaux et Systèmes de Sophia Antipolis (INRIA-CNRS-Université Côte d’Azur ) et dans l’équipe Maasai (Inria). Arnaud Droit est professeur agrégé au Département de médecine moléculaire de la Faculté de médecine de l’Université Laval, et chercheur au Centre de recherche du CHU de Québec-Université Laval, où il dirige la plateforme de bio-informatique et de protéomique. Il est également chercheur membre de l’IID. Ces travaux sont au coeur de la thèse de Khawla Seddiki, doctorante au sein du laboratoire d’Arnaud Droit.
Lire l’article dans Nature Communications
Lire le communiqué de l’Université Côte-d’Azur concernant la publication
Résumé de l’article (en anglais)
Rapid and accurate clinical diagnosis remains challenging. A component of diagnosis tool development is the design of effective classification models with Mass spectrometry (MS) data. Some Machine Learning approaches have been investigated but these models require time-consuming preprocessing steps to remove artifacts, making them unsuitable for rapid analysis. Convolutional Neural Networks (CNNs) have been found to perform well under such circumstances since they can learn representations from raw data. However, their effectiveness decreases when the number of available training samples is small, which is a common situation in medicine. In this work, we investigate transfer learning on 1D-CNNs, then we develop a cumulative learning method when transfer learning is not powerful enough. We propose to train the same model through several classification tasks over various small datasets to accumulate knowledge in the resulting representation. By using rat brain as the initial training dataset, a cumulative learning approach can have a classification accuracy exceeding 98% for 1D clinical MS-data. We show the use of cumulative learning using datasets generated in different biological contexts, on different organisms, and acquired by different instruments. Here we show a promising strategy for improving MS data classification accuracy when only small numbers of samples are available.
Un partenariat privilégié entre Université Côte d'Azur et Université Laval
Ces travaux sont le fruit du partenariat privilégié et dynamique qui unit Université Côte d’azur et l’Université Laval depuis 2015 et qui repose sur une collaboration fructueuse associant enseignants, chercheurs et étudiants des deux côtés de l’Atlantique.
Restons en contact!
Vous souhaitez être informé des nouvelles et activités de l'IID? Abonnez-vous dès maintenant à notre infolettre mensuelle.