【论文阅读笔记】图像理解中的卷积神经网络(常亮等)

【论文阅读笔记】图像理解中的卷积神经网络(常亮等)

文章的中心思想:卷积神经网络在图像理解中的研究进展与典型应用

部分文章摘要
1 背景与研究现状
1986年,Rumelhart等首次提出人工神经网络的反向传播算法,掀起了神经网络在机器学习中的研究热潮。(可参考论文 Learning representation by back-propagating errors. Nature,1986)
基于统计学习理论的支持向量机、Boosting、Logistic回归方法可以被看作具有一层隐节点或者不含隐节点的学习模型,被称为浅层机器学习模型。浅层学习模型通常需要由人工方法获取好的样本特征,在此基础上进行识别和预测,因此方法的有效性很大程度上受到特征提取的制约。
2006年,Hinton等人提出深度学习这一概念,主要阐述了两个观点:1.多隐层神经网络具有优越的特征学习能力,学习到的数据更能反应数据的本质特征,有利于可视化或分类。2.深度神经网络在训练上的难道可以通过逐层无监督训练有效克服。(可参考论文 Reducing the dimensionality of data with neural network.Science,2006)
近年来,深度学习取得成功的主要原因有:1.在训练数据上,大规模训练数据出现,如ImageNet。2.计算机硬件的飞速发展(特别是GPU的出现),使训练大规模神经网络成为可能。与浅层学习模型相比,深度学习构造了具有多隐层的学习模型,设计了有效的学习算法并能够加速计算,从而能够对大数据进行处理;通过深度学习能够得到更高层的特征,从而提高样本的识别率或预测的准确率。

2 卷积神经网络
卷积神经网络(CNN)是一种带有卷积结构的深度神经网络,卷积结构可以减少深层网络占用的内存量,也可以减少网络的参数个数,缓解模型的过拟合问题。卷积网络是为识别二维形状而特殊设计的一个多层感知器。**在典型的CNN中,开始几层通常是卷积层和下采样层的交替,在靠近输出层的最后几层网络通常是全连接网络。**卷积神经网络的训练过程主要是学习卷积层的卷积核参数和层间连接权重等网络参数,预测过程主要是基于输入图像和网络参数计算类别标签。

接下来的卷积神经网络的结构和反向传播的算法主要参考文献(Bouvrie J. Notes on Convolutional Neural Networks,MITCBCL Tech Report,Cambridge,MA,2006)
网络结构:卷积层–下采样层(池化层)–全连接层
在卷积层,上一层的特征图被一个可学习的卷积核进行卷积,然后通过一个激活函数,就可以得到输出特征图。每个特征图可以组合卷积多个特征图的值。下采样层将每一个输入特征图通过下面的公式下采样输出特征图(在这一层图像缩小了)。全连接层相当于对前面的卷积层和池化层的特征做特征加权,起到分类器的作用。
卷积神经网络的优势:
每个神经元只需要感受局部的图像区域,在更高层将在这些感受不同局部区域的神经元综合起来就可以得到全局的信息。因此,可以减少网络连接的数目,即减少神经网络需要训练的全职参数的个数。

3卷积神经网络在图像理解中的进展与应用
关于场景的语义分割和深度恢复,场景的语义分割是指对于一幅图像中的每一个像素给出其所属于的场景类别,场景深度恢复是基于色彩或灰度图像恢复每个像素对应深度的问题,两者实质都是对输入图像的每个像素进行分类或回归,已有方法集中在如何同时考虑单个像素的预测以及场景蕴含的上下文约束。
语义分割的发展进程:
Farabet等使用多尺度的卷积神经网络对输入图像进行特征提取,并结合超像素划分和条件随机场,得到像素语义的分类。
Pinheiro等将场景分割与目标检测相结合,联合训练两个目标。
Mohan在卷积神经网络中加入了反卷积层,从而实现一种端对端的全卷积神经网络FCN,将全连接层变为核大小为1的全卷积层,使FCN可以接受任意大小的输入。(可参考文献Deep deconvolutional network for scene parsing)
zheng等将条件随机场转变成为一种递归神经网络层,连接在FCN之后,对FCN的结果进行平滑和优化,得到细节更具体更平滑的分割效果…

4 总结与讨论
作者在最后提出了往后可能的研究方向:

  1. 卷积神经网络将卷积、池化与神经网络结合,有效地利用了图像的结构信息。进一步,如何有效利用领域知识,改进网络结构来获取视觉上的不变性?
  2. 在理论上,如何在算法中利用深度模型的选择性、稀疏性,如何设计算法保证收敛性?
  3. 目前,GoogLeNet,VGG的网络结构已超过20层,如何针对更大规模数据、更深结构网络设计高效的数值优化、并行计算方法和平台?
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值