«Matching Feature Sets for Few-Shot Image Classification»: des chercheurs de l'IID au programme du CVPR 2022

L’IEEE / CVF Computer Vision and Pattern Recognition Conference (CVPR) est l’événement annuel le plus important dans le domaine de la vision par ordinateur. Un article produit par des étudiants et des chercheurs de l’IID figure à la programmation de l’événement, «Matching Feature Sets for Few-Shot Image Classification» par Arman Afrasiyabi, Jean-François Lalonde, Christian Gagné, ainsi qu’Hugo Larochelle de Google Brain. 

Résumé de l'article :

In image classification, it is common practice to train deep networks to extract a single feature vector per input image. Few-shot classification methods also mostly follow this trend.

In this work, we depart from this established direction and instead propose to extract sets of feature vectors for each image. We argue that a set-based representation intrinsically builds a richer representation of images from the base classes, which can subsequently better transfer to the few-shot classes. To do so, we propose to adapt existing feature extractors to instead produce sets of feature vectors from images. Our approach, dubbed SetFeat, embeds shallow self-attention mechanisms inside existing encoder architectures. The attention modules are lightweight, and as such our method results in encoders that have approximately the same number of parameters as their original versions. During training and inference, a set-to-set matching metric is used to perform image classification.

The effectiveness of our proposed architecture and metrics is demonstrated via thorough experiments on standard few-shot datasets — namely miniImageNet, tieredImageNet, and CUB — in both the 1- and 5-shot scenarios. In all cases but one, our method outperforms the state-of-the-art.

À propos de CVPR 2022 :

Présentée du 19 au 23 juin en direct de la Nouvelle-Orléans, aux États-Unis, la conférence IEEE / CVF sur la vision par ordinateur et la reconnaissance des formes (CVPR) est le principal événement annuel dans le domaine de la vision par ordinateur, qui comprend la conférence principale et plusieurs ateliers et cours de courte durée. Avec sa haute qualité et son faible coût, elle offre une valeur exceptionnelle aux étudiants, aux universitaires et aux chercheurs de l’industrie.

La CVPR 2022 sera une conférence hybride, avec des options de participation en personne et virtuelle. Le contenu de la conférence hébergé sur la plateforme virtuelle sera disponible exclusivement pour les participants inscrits à la CVPR. Les actes de la conférence seront accessibles au public via le site Web de la CVPR, et la version finale sera publiée sur IEEE Xplore après la conférence.

Consulter le programme de l’événement

Restons en contact!

Vous souhaitez être informé des nouvelles et activités de l'IID? Abonnez-vous dès maintenant à notre infolettre mensuelle.