Type de document : Publication ("Paper")
Auteur : Kelvin Xu
Année : 2016
Langue : Anglais
Format : Adobe PDF
Nombre de pages : 22
Résumé :
Inspiré des travaux récents en traduction automatique et détection d'objets, nous introduisons un modèle basé sur le mécanisme d'attention qui apprend automatiquement à décrire le contenu d'images. Nous décrivons comment nous pouvons entraîner ce modèle de manière déterministe en utilisant des techniques de rétropropagation standard et stochastique en maximisant la valeur d'une limite inférieure variable. Nous montrons également par la visualisation comment le modèle est capable d'apprendre automatiquement à fixer son regard sur des objets remarquables tout en générant les mots correspondants dans la séquence de sortie. Nous validons l'utilisation du mécanisme d'attention avec des performances de pointe sur trois jeux de données de référence : Flickr8k, Flickr30k et MS COCO.
(c) Google Translate
Document :