WACV 2021 论文大盘点-图像与视频检索篇

最新推荐文章于 2023-03-28 11:27:08 发布

OpenCV中文网公众号

最新推荐文章于 2023-03-28 11:27:08 发布

阅读量1.1k

点赞数

文章标签：计算机视觉机器学习人工智能深度学习编程语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bevison/article/details/113449575

版权

本篇总结检索相关论文，包含视觉搜索、图像视频检索、跨域检索等。

值得关注的是由 Andrés Mafla 为一作的两篇检索类文章都入选了该会议，一篇是场景文本感知跨模态检索（StacMR）任务；一篇是融合多模态推理模块，结合文字和视觉特征对场景文本进行图像分类与检索，都取得了不错的成绩。

共计 9 篇。如有遗漏，欢迎补充。

下载包含这些论文的 WACV 2021 所有论文：

『WACV 2021 开幕，更偏重技术应用，附论文下载』

视觉搜索

Structured Visual Search via Composition-aware Learning

引入 composition-aware 学习概念，用于结构化图像搜索。

该方法由三部分组成：

Composition-aware transformation：计算输入和输出空间的变换

Composition-aware loss function：根据输入输出变换的差异更新网络参数

Composition-equivariant CNN：用于学习转换的骨干

并证明所提出方法在特征空间和数据空间都是有效的。在 MS-COCO 和 HICO-DET 两个大规模数据集上对所提出方法与具有竞争力技术相比，有相当大的改进。

作者 | Mert Kilickaya, Arnold W.M. Smeulders

单位 | 阿姆斯特丹大学

论文 | https://arxiv.org/abs/2010.14438

图像检索

Multi-Modal Reasoning Graph for Scene-Text Based Fine-Grained Image Classification and Retrieval

本次研究中所提出的一种新架构，通过考虑图像的文本和视觉特征，在两个数据集中大大超越了以往最先进的结果，在细粒度分类上超过 5%，在图像检索上超过 10%。

设计一个完全的端到端可训练 pipeline，融合了多模态推理模块，结合文字和视觉特征࿰

最低0.47元/天解锁文章

OpenCV中文网公众号

关注

0
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
WACV 2021 论文大盘点-图像与视频检索篇

本篇总结检索相关论文，包含视觉搜索、图像视频检索、跨域检索等。值得关注的是由 Andrés Mafla 为一作的两篇检索类文章都入选了该会议，一篇是场景文本感知跨模态检索（StacMR）...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。