【论文笔记】Saliency-Guided Attention Network for Image-Sentence Matching

最新推荐文章于 2023-06-17 14:21:28 发布

hatake.18

最新推荐文章于 2023-06-17 14:21:28 发布

阅读量931

点赞数

本文链接：https://blog.csdn.net/weixin_45570101/article/details/109046624

版权

6 篇文章 1 订阅

订阅专栏

文章来源：ECCV 2019
创新点：将显著性检测引入图文匹配，框架图如下所示
在这里插入图片描述

图片表示由两部分组成

显著性检测
对整张图进行显著性检测，将网络中不同层的输出进行级联，全连接等操作，最终得到一个显著性注意力权重，将其与region向量相乘，作为显著性视觉向量。
目标检测
检测出图片的多个region，将其特征做加和处理

将上面两个输出的特征进行average pooling作为视觉特征

双向GRU，将每个word的特征做加和处理

将文本和图片的特征做加和进行融合，文本和图片分别与融合后的特征进行Attention操作，利用Attention结果进行匹配操作。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注