基于内容的图像检索技术(3):部分论文阅读总结

最新推荐文章于 2022-11-07 10:05:05 发布

张叫张大卫

最新推荐文章于 2022-11-07 10:05:05 发布

阅读量2k

点赞数 3

文章标签：基于内容的图像检索

本文链接：https://blog.csdn.net/weixin_40100431/article/details/86722426

版权

本文总结了几篇关于图像检索的论文，探讨了如何利用深度学习改进传统VLAD算法，包括从卷积网络中提取特征，使用NetVLAD构建端到端网络，以及提出Deep Relative Distance Learning优化三元组损失函数。此外，还提到了基于CNN的哈希编码方法和DELF方法在图像检索中的应用，以及改进的RootSIFT、查询扩展和图像增强模型在提高检索性能上的作用。

摘要由CSDN通过智能技术生成

[1] Ng Y H , Yang F , Davis L S . Exploiting Local Features from Deep Networks for Image Retrieval[J]. 2015.

传统的VLAD算法从sift特征中进行计算，这篇文章从卷积网络中进行提取特征，然后使用vlad方法。除此之外，文章有两个贡献（1）从不同层中提取卷积特征，并采用VLAD将特征编码为每一个图像的单个矢量。（2）使用了两个OxfordNet和GoogleNet研究输入图像的不同层和尺度对卷积性能的影响。实验表明，与之后一层提取特征相比，前面的层可能产生更好的检索结果。

[2] Arandjelovic R , Gronat P , Torii A , et al. NetVLAD: CNN architecture for weakly supervised place recognition[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017:1-1.

本文是进行图像地点检索，其主要是将VLAD的计算方式纳入到了深度网络之中（通过典型深度网络层，例如softmax层，卷积层，正则化就能将vlad实现），形成一个端到端的网络，其通过数学方式将VLAD与卷积网络结合，形成网络的一个中间层，损失函数使用了图像检索中常常使用的triplet loss，是一篇很优秀的文章。
在这里插入图片描述