Identifier les requis d'un appel d'offres

Développer une méthode et un prototype pour le repérage automatique des requis dans des appels d’offre par apprentissage automatique avec un réseau de neurones.

Stagiaire : Maxime Leclerc
Entreprise : Umaneo

L’objectif de ce stage est de développer une méthode et un prototype pour le repérage automatique des requis dans des appels d’offre par apprentissage automatique avec un réseau de neurones.

Les données proviendront d’une banque d’appels d’offres du gouvernement fédéral. Dans un premier temps, le travail sera réalisé avec des appels d’offres en anglais, mais le site du gouvernement fédéral permet également de récupérer la version française de chaque document, ce qui pourrait être intéressant dans le futur. Grâce à l’implémentation de Word2Vec dans la librairie Gensim, une analyse sémantique latente (latent semantic analysis) des mots sera faite. Il s’agit ici d’examiner les relations reliées au contexte plutôt qu’à la synonymie ou à l’hyperonymie. Ces relations peuvent être extraites à partir d’un grand corpus de textes.

Un modèle Word2Vec sera donc entraîné sur l’ensemble des documents pour identifier les mots qui apparaissent souvent dans un contexte similaire. Cela permettra de créer un dictionnaire avec des relations entre les mots qui sera ensuite utilisé pour la production automatique de règles et l’entraînement d’un réseau de neurones. La base de données lexicales WordNet sera également utilisée dans les mêmes fins que Word2Vec. Un réseau de neurones récurrent qui aura la forme d’un classificateur à base de mots avec un enrichissement linguistique (Token-Level Classification with Linguistic Features) pourra alors être entrainé.

La librairie Keras de Python [8] sera utilisée pour entraîner des réseaux de neurones dans le but de répondre à deux objectifs :

  • L’identification des phrases contenant un requis
  • L’identification plus précise des requis.

Si le temps le permet, une approche mixte sera ensuite développée, soit l’utilisation d’un réseau de neurones combiné aux règles établies plus tôt. Le but est de cibler la meilleure approche pour le repérage des requis.

Restons en contact!

Vous souhaitez être informé des nouvelles et activités de l'IID? Abonnez-vous dès maintenant à notre infolettre mensuelle.