注意力机制（三）：Position Focused Attention Network for Image-Text Matching

最新推荐文章于 2024-08-08 16:38:28 发布

qq2285580599

最新推荐文章于 2024-08-08 16:38:28 发布

阅读量932

点赞数

分类专栏：深度学习_监督_跨模态检索

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq2285580599/article/details/112687856

版权

深度学习_监督_跨模态检索专栏收录该内容

10 篇文章 1 订阅 ¥99.90 ¥299.90

订阅专栏

超级会员免费看

该博客探讨了现有注意机制忽视图像中相对位置信息的问题，并提出位置聚焦注意网络（Position Focused Attention Network），通过整合区域位置信息增强图像区域与文本单词的对应。实验部分展示了在Flickr30K、MS-COCO和Tencent-News数据集上的召回率表现。

摘要由CSDN通过智能技术生成

Motivation

1，现有的注意机制只关注图像区域的视觉特征，而忽略了图像中的相对位置信息。

2，物体在整幅图像中的相对位置是一个重要而有用的线索，

Contributions

1，我们整合区域的位置信息来研究图像中的物体和句子中的单词之间的对应关系。

2，我们提出了一种位置聚焦的注意机制，为图像区域生成有价值的位置特征，位置特征与视觉特征共同构成了对图像区域更可靠、更完整的表达。

Framework

Initial Position Representation

我们把图像表示为，其中n是区域的数目，我们把图片分为k * k个块，块的次序

了解本专栏

超级会员免费看

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。