本篇总结检索相关论文,包含视觉搜索、图像视频检索、跨域检索等。
值得关注的是由 Andrés Mafla 为一作的两篇检索类文章都入选了该会议,一篇是场景文本感知跨模态检索(StacMR)任务;一篇是融合多模态推理模块,结合文字和视觉特征对场景文本进行图像分类与检索,都取得了不错的成绩。
共计 9 篇。如有遗漏,欢迎补充。
下载包含这些论文的 WACV 2021 所有论文:
视觉搜索
Structured Visual Search via Composition-aware Learning
引入 composition-aware 学习概念,用于结构化图像搜索。
该方法由三部分组成:
Composition-aware transformation:计算输入和输出空间的变换
Composition-aware loss function:根据输入输出变换的差异更新网络参数
Composition-equivariant CNN:用于学习转换的骨干
并证明所提出方法在特征空间和数据空间都是有效的。在 MS-COCO 和 HICO-DET 两个大规模数据集上对所提出方法与具有竞争力技术相比,有相当大的改进。
作者 | Mert Kilickaya, Arnold W.M. Smeulders
单位 | 阿姆斯特丹大学
论文 | https://arxiv.org/abs/2010.14438
图像检索
Multi-Modal Reasoning Graph for Scene-Text Based Fine-Grained Image Classification and Retrieval
本次研究中所提出的一种新架构,通过考虑图像的文本和视觉特征,在两个数据集中大大超越了以往最先进的结果,在细粒度分类上超过 5%,在图像检索上超过 10%。