深度学习与计算机视觉(11)_基于deep learning的快速图像检索系统

作者:寒小阳
时间:2016年3月。
出处:http://blog.csdn.net/han_xiaoyang/article/details/50856583
声明:版权所有,转载请联系作者并注明出处

1.引言

本系统是基于CVPR2015的论文《Deep Learning of Binary Hash Codes for Fast Image Retrieval》实现的海量数据下的基于内容图片检索系统,250w图片下,对于给定图片,检索top 1000相似时间约为1s,其基本背景和原理会在下文提到。

2.基本问题与技术

大家都知道,基于内容的图像检索系统是根据图像的内容,在已有图像集中找到最『相近』的图片。而这类系统的效果(精准度和速度)和两个东西直接相关:

  • 图片特征的表达能力
  • 近似最近邻的查找

根据我们这个简单系统里的情况粗浅地谈谈这两个点。

首先说图像特征的表达能力,这一直是基于内容的图像检索最核心却又困难的点之一,计算机所『看到』的图片像素层面表达的低层次信息与人所理解的图像多维度高层次信息内容之间有很大的差距,因此我们需要一个尽可能丰富地表达图像层次信息的特征。我们前面的博客也提到了,deep learning是一个对于图像这种层次信息非常丰富的数据,有更好表达能力的框架,其中每一层的中间数据都能表达图像某些维度的信息,相对于传统的Hist,Sift和Gist,表达的信息可能会丰富一下,因此这里我们用deep learning产出的特征来替代传统图像特征,希望能对图像有更精准的描绘程度。

再说『近似最近邻』,ANN(Approximate Nearest Neighbor)/近似最近邻一直是一个很热的研究领域。因为在海量样本的情况下,遍历所有样本,计算距离,精确地找出最接近的Top K个样本是一个非常耗时的过程,尤其有时候样本向量的维度也相当高,因此有时候我们会牺牲掉一小部分精度,来完成在很短的时间内找到近似的top K个最近邻,也就是ANN,最常见的ANN算法包括局部敏感度哈希/locality-sensitive hashing最优节点优先/best bin firstBalanced box-decomposition tree等,我们系统中将采用LSH/局部敏感度哈希来完成这个过程。有一些非常专业的ANN库,比如FLANN,有兴趣的同学可以了解一下。

3. 本检索系统原理

图像检索系统和关键环节如下图所示:
基于内容的图像检索

图像检索过程简单说来就是对图片数据库的每张图片抽取特征(一般形式为特征向量),存储于数据库中,对于待检索图片,抽取同样的特征向量,然后并对该向量和数据库中向量的距离,找出最接近的一些特征向量,其对应的图片即为检索结果。

基于内容的图像检索系统最大的难点在上节已经说过了,其一为大部分神经网络产出的中间层特征维度非常高,比如Krizhevsky等的在2012的ImageNet比赛中用到的AlexNet神经网,第7层的输出包含丰富的图像信息,但是维度高达4096维。4096维的浮点数向量与4096维的浮点数向量之间求

  • 23
    点赞
  • 171
    收藏
    觉得还不错? 一键收藏
  • 37
    评论
### 回答1: 《envi deep learning v1.0深度学习操作教程_202003.pdf》是一本关于ENVI深度学习版本1.0的操作教程。ENVI是一款专业的遥感图像处理软件,而深度学习则是当前计算机视觉和人工智能领域的热门技术。 这本教程主要针对ENVI深度学习版本1.0进行了详细的操作说明和教学。这个版本的ENVI深度学习提供了一系列针对遥感图像处理的深度学习工具和算法,方便用户利用深度学习技术进行更加精确和高效的图像处理和分析。 教程中首先介绍了ENVI深度学习的基本原理和背景知识,包括深度学习的基本概念、神经网络和常见的深度学习算法等。接着,教程详细介绍了ENVI深度学习版本1.0的安装和设置步骤,以及软件界面和主要功能的使用方法。 在教程中,作者还针对常见的遥感图像处理任务,如图像分类、目标检测和图像分割等,提供了具体的操作步骤和示例。通过这些示例,读者可以学习如何使用ENVI深度学习版本1.0进行不同任务的图像处理和分析。 总的来说,这本教程对于想要学习和掌握ENVI深度学习版本1.0的操作和应用的用户来说是一本非常实用的指南。通过学习这本教程,用户可以了解深度学习在遥感图像处理领域的应用,提高自己的图像分析能力,并在实际项目中应用这些技术。 ### 回答2: envi deep learning v1.0深度学习操作教程_202003.pdf是一本关于ENVI深度学习版本1.0操作教程的PDF文档。ENVI是一种用于图像处理和空间数据分析的软件,而深度学习是一种机器学习的分支,通过模拟人脑神经网络的工作原理来处理复杂的问题。 该教程旨在帮助读者了解如何使用ENVI进行深度学习任务。它包括了深度学习的基本概念和原理,以及如何用ENVI软件进行深度学习的具体操作。在教程中,读者将学习如何准备输入数据、选择合适的深度学习模型、进行模型训练和评估,以及如何使用训练好的模型进行预测和分类。 该教程涵盖了广泛的主题,包括数据预处理、特征提取、模型训练和调整等。读者将学习如何使用ENVI软件中提供的工具和功能来进行这些操作,并了解如何解决在深度学习任务中常见的问题和挑战。 通过学习这本教程,读者将能够掌握ENVI深度学习版本1.0的操作技巧,能够在图像处理和空间数据分析中应用深度学习算法。这将为他们在各种领域中解决复杂问题提供有力的工具和方法。无论是在环境科学、地理信息系统还是其他相关领域,ENVI深度学习操作教程都会为读者提供宝贵的知识和经验。 ### 回答3: 《envi deep learning v1.0深度学习操作教程_202003.pdf》是一份关于使用envi deep learning v1.0进行深度学习操作的教程。envi deep learning是一种用于遥感图像分析的深度学习工具,提供了一套丰富的功能和算法,用于解决从遥感图像中提取信息和进行分类的问题。 在这份教程中,首先介绍了envi deep learning v1.0的基本原理和使用环境的配置。接着,详细介绍了深度学习的基本概念和方法,包括卷积神经网络(CNN)和迁移学习。然后,教程重点讲解了如何使用envi deep learning进行遥感图像分类和目标检测,包括数据准备、模型设计和训练过程。同时,还介绍了常见的遥感图像数据集和应用案例,并提供了相关的代码示例和实验步骤。 这份教程的设计旨在让初学者能够快速上手并掌握envi deep learning v1.0的使用技巧。通过学习这份教程,读者可以了解到如何利用深度学习技术处理和分析遥感图像,包括提取地物信息、进行分类和目标检测等任务。同时,教程还提供了实用的技巧和注意事项,帮助读者克服在实际应用中遇到的常见问题。 总之,《envi deep learning v1.0深度学习操作教程_202003.pdf》是一份很有价值的教程,它详细介绍了envi deep learning v1.0的使用方法,帮助读者快速掌握遥感图像深度学习的基本理论和实践技巧。无论是初学者还是有一定经验的研究人员,都可以通过学习这份教程提升自己的研究能力和实践能力。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 37
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值