Vie privée

Lorsque vous visitez ce site, celui-ci peut stocker ou récupérer des informations sur votre navigateur, principalement sous forme de témoins (cookies). Ces informations ne permettent pas de vous identifier directement, elles sont utilisées pour faciliter la navigation et offrir une expérience plus personnalisée.... 

Toujours actif

Ces témoins sont indispensables au bon fonctionnement du site web et ne peuvent pas être désactivés de nos systèmes. Ils ne sont généralement qu’activés en réponse à des actions que vous effectuez, comme la configuration de vos préférences de confidentialité, la connexion ou le remplissage de formulaires.

Ces témoins permettent d’améliorer les fonctionnalités et la personnalisation de notre site, telles que par exemple l’utilisation de vidéos et de services de messagerie instantanée. Si vous n’acceptez pas cette catégorie de témoins, certaines ou toutes ces fonctionnalités seront susceptibles ne pas fonctionner correctement.

Aucun cookie à afficher.

Ces témoins nous permettent de déterminer le nombre de visites et les sources du trafic sur notre site web, afin d’en mesurer et d’en améliorer les performances. Ils nous aident également à identifier les pages les plus/moins visitées et à évaluer comment les visiteurs naviguent sur le site. Toutes les informations, collectées par ces témoins, sont agrégées et donc anonymisées.

Ces témoins peuvent être activés sur notre site web pour établir des profils sur vos intérêts. Ils nous aident à vous proposer des publicités et des contenus personnalisés sur d’autres sites. Si vous n’acceptez pas cette catégorie de témoins, des publicités moins ciblées sur vos intérêts vous seront proposées lors de votre navigation sur d’autres sites web.

Aucun cookie à afficher.

Expliquer l’impact des graphes de connaissances dans les systèmes VQA

Améliorer la représentation relationnelle entre les objets détectés dans l’image, ou entre les entités en question et les objets dans l’image.

Projet de stage – hiver 2021

Stagiaire : Xavier Zientarski Capriles
Entreprise : Thales

La réponse visuelle aux questions (Visual Question Answering VQA [1]) a été introduite pour combler le fossé entre le traitement du langage naturel et les applications de compréhension des images dans l’espace commun de la vision et du langage. La plupart des benchmarks VQA calculent une représentation de la question en utilisant des techniques d’intégration de mots et des réseaux neuronaux récurrents (RNN), ainsi qu’un ensemble de descripteurs d’objets comprenant des coordonnées de boîtes englobantes et des vecteurs de caractéristiques d’images. Les représentations des mots et des images sont ensuite fusionnées et transmises à un réseau pour former un modèle VQA.

Toutefois, ces approches ne sont d’aucune utilité lorsque des connaissances allant au-delà du contenu visuel sont nécessaires.

L’intégration des connaissances externes présente plusieurs avantages. Les connaissances externes et les faits à l’appui peuvent améliorer la représentation relationnelle entre les objets détectés dans l’image, ou entre les entités en question et les objets dans l’image. Elles fournissent également des informations sur la manière dont la réponse peut être obtenue à partir de la question. Par conséquent, la complexité des questions peut être augmentée selon la base de connaissances de support.

Restons en contact!

Vous souhaitez être informé des nouvelles et activités de l'IID? Abonnez-vous dès maintenant à notre infolettre mensuelle.