基于内容的图像检索技术(3):部分论文阅读总结

本文总结了几篇关于图像检索的论文,探讨了如何利用深度学习改进传统VLAD算法,包括从卷积网络中提取特征,使用NetVLAD构建端到端网络,以及提出Deep Relative Distance Learning优化三元组损失函数。此外,还提到了基于CNN的哈希编码方法和DELF方法在图像检索中的应用,以及改进的RootSIFT、查询扩展和图像增强模型在提高检索性能上的作用。
摘要由CSDN通过智能技术生成

[1] Ng Y H , Yang F , Davis L S . Exploiting Local Features from Deep Networks for Image Retrieval[J]. 2015.

传统的VLAD算法从sift特征中进行计算,这篇文章从卷积网络中进行提取特征,然后使用vlad方法。除此之外,文章有两个贡献 (1)从不同层中提取卷积特征,并采用VLAD将特征编码为每一个图像的单个矢量。 (2)使用了两个OxfordNet和GoogleNet研究输入图像的不同层和尺度对卷积性能的影响。实验表明,与之后一层提取特征相比,前面的层可能产生更好的检索结果。

[2] Arandjelovic R , Gronat P , Torii A , et al. NetVLAD: CNN architecture for weakly supervised place recognition[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017:1-1.

本文是进行图像地点检索,其主要是将VLAD的计算方式纳入到了深度网络之中(通过典型深度网络层,例如softmax层,卷积层,正则化就能将vlad实现),形成一个端到端的网络,其通过数学方式将VLAD与卷积网络结合,形成网络的一个中间层,损失函数使用了图像检索中常常使用的triplet loss,是一篇很优秀的文章。
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值