WACV 2021 论文大盘点-图像与视频检索篇

本篇总结检索相关论文,包含视觉搜索、图像视频检索、跨域检索等。

值得关注的是由 Andrés Mafla 为一作的两篇检索类文章都入选了该会议,一篇是场景文本感知跨模态检索(StacMR)任务;一篇是融合多模态推理模块,结合文字和视觉特征对场景文本进行图像分类与检索,都取得了不错的成绩。

共计 9 篇。如有遗漏,欢迎补充。

下载包含这些论文的 WACV 2021 所有论文:

WACV 2021 开幕,更偏重技术应用,附论文下载

视觉搜索

Structured Visual Search via Composition-aware Learning

引入 composition-aware 学习概念,用于结构化图像搜索。

该方法由三部分组成:

Composition-aware transformation:计算输入和输出空间的变换

Composition-aware loss function:根据输入输出变换的差异更新网络参数

Composition-equivariant CNN:用于学习转换的骨干

并证明所提出方法在特征空间和数据空间都是有效的。在 MS-COCO 和 HICO-DET 两个大规模数据集上对所提出方法与具有竞争力技术相比,有相当大的改进。

作者 | Mert Kilickaya, Arnold W.M. Smeulders

单位 | 阿姆斯特丹大学

论文 | https://arxiv.org/abs/2010.14438

图像检索

Multi-Modal Reasoning Graph for Scene-Text Based Fine-Grained Image Classification and Retrieval

本次研究中所提出的一种新架构,通过考虑图像的文本和视觉特征,在两个数据集中大大超越了以往最先进的结果,在细粒度分类上超过 5%,在图像检索上超过 10%。

设计一个完全的端到端可训练 pipeline,融合了多模态推理模块,结合文字和视觉特征࿰

  • 0
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值