Hashing based Efficient Inference for Image-Text Matching论文笔记

最新推荐文章于 2022-09-04 14:33:07 发布

weixin_42863990

最新推荐文章于 2022-09-04 14:33:07 发布

阅读量234

点赞数

文章标签：深度学习自然语言处理神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42863990/article/details/120144041

版权

Hashing based Efficient Inference for Image-Text Matching

motivation

这篇论文认为今年提出的image-text matching方法，虽然达到了很好的效果，但是由于在匹配的时候需要同时输入查询词和被查询词到跨模态注意力机制中，这将消耗大量的时间，在实际使用的时候是不可接受的，因此提出了HEI模块为现存的cross model retrieval在不影响性能的前提下加快检索速度。（最近我也想能不能从这边着手没想到就碰到了这篇论文。。。）

Contribution

第一个使用hashing来加速cross model retrieval 模型的方法（as they acknowledge。。。），在加速的同时还没有损害到模型性能。

Method

从一般的具有局部细粒度对齐的跨模态检索任务中取得三部分数据，分别是region feature of image、word feature of sentence和cross model attention score。（不过也可能是我理解不准确，可能image和sentence的feature是HEI module经过了重新训练的，它这个图挺有误导性的也没有给代码我只能靠猜了。）

然后通过注意力机制对visual feature vi和sentence feature ui进行以下处理：

再然后计算一个针对哈希码匹配和使用cross model attention（sij是通过嵌入的模型中的跨模态注意力机制产生的）软监督产生的loss：

然后模块的部分就完了

笔记

使用计算更加简便的模型来对数据集进行粗提取这个思路还挺不错的，虽然方法很简单。之前总是吐槽一些顶会论文的符号没有表达清楚，不过这篇论文的符号描述就过于详细。。。

weixin_42863990

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
Hashing based Efficient Inference for Image-Text Matching论文笔记

Hashing based Efficient Inference for Image-Text Matchingmotivation这篇论文认为今年提出的image-text matching方法，虽然达到了很好的效果，但是由于在匹配的时候需要同时输入查询词和被查询词到跨模态注意力机制中，这将消耗大量的时间，在实际使用的时候是不可接受的，因此提出了HEI模块为现存的cross model retrieval在不影响性能的前提下加快检索速度。（最近我也想能不能从这边着手没想到就碰到了这篇论文。。。）C
复制链接

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。