图像检索系统现在主要分为两个阶段:
- 过滤,这是一种根据数据库图像与查询图像的相似性对数据库图像进行排序的有效技术。
- 重排名:其中一小部分来自第一阶段的最相似的数据库图像被更详细地检查并重新排序。(局部特征匹配和几何验证)
本文的贡献:
- 本文引入了一个手动标注bounding box的landmark图像数据集(其中有15k个类别,共86k张图像),同时本文展示了检测器能够训练为鲁棒性的landmark定位。
- 利用了训练过的检测器,生成更有效的区域搜索系统,这提高了小目标的准确率且只略微增加了数据集的尺寸。这比以前提出的方法更有效。
- 本文提出了区域聚合匹配内核去利用选定的图像区域生成一个判别图像表征。这个新的表征比区域搜索系统好很多,同时也是更有效地,其每张图片只需要保存一个descriptor。
![](https://img-blog.csdnimg.cn/20201010091223412.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2FvanVhbjM1NTI=,size_16,color_FFFFFF,t_70)
![](https://img-blog.csdnimg.cn/20201010091731522.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2FvanVhbjM1NTI=,size_16,color_FFFFFF,t_70)
本文的方法是在DELF(deep local features)和ASMK(aggregated selective match kernels)上构建的。主要是利用训练好的landmark检测器预测得到的bboxes去增强图像检索系统的表现。