计算机视觉入门之关于卷积神经网络

学习记录&输出收获

关于卷积神经网络

卷积神经网络CNN(convolutional neural network)一般由(图片)输入层,(CONV)卷积层,(POOL)池化层,(FC)连接层构成.
仍然是层结构

下面主要以二维的图像识别为例子进行理解

输入层

我理解的是对于图像的预处理.
一般有三种图像处理手段

  • 均值化:将各个维度都中心化到零.即求平均后,原值减去均值
  • 归一化:将所有的数据的归一化到同一范围之中
  • 白化:让所有的维度的相关度取消,特征之间相互独立.(这里一般使用PCA进行处理)

卷积层

卷积层得名于卷积运算.
即进行特征图的提取
要识别图像中的某种特定特征,即图像经过滤波器后要对这种特征有很高的输出,对其他弱特征则输出很低,这样在输出的特征图中便可以很容易的识别出特征
我们对整个原图进行一次卷积,得到的结果中,在那个特定特征和周边区域,值就很高,在其他区域,值相对低。这就是一张特征图

上面是通俗化的理解


关于filter的局部扫描图像

图像的中某些特征的表现是由像素点与其附近的像素点共同构成从而表现出来的.距离越远,相关度越小.(局部关联)
这意味着不用处理全局的图像,只需要每一层都只需要和上一层局部连接,相当于只是扫描一小区域
然后许多神经元单位(权值共享)合起来(全连接层的工作)就相当于扫描了全局
这样就构成一个特征图,n个特征图就提取了这个图片的n维特征,每个特征图是由很多层共同处理完成的

关于特征图的输出

在卷积层中,一个图像原始矩阵和核(kernel)矩阵通过卷积运算输出特征矩阵

原动图,原始图像矩阵的左上角经过过滤器的扫描,产生一个特征矩阵的特征值.这样便提取的图像的特征

这里是示意图
如果是多通道,比如常见的RGB三色的图像的识别,则需要深度为三的过滤器进行响应多通道的识别.
这样经过多重卷积层的识别,多个不同的filter提取的不同的特征进行结合,再加上梯度上升算法,不停迭代优化权值,就可以优化深度网络的效果.便可以尽量多的提取原图像中的特征.


下面是相关名词点

  • kernel也称为卷积核或者过滤器(kernel)
    关于filter的形象理解,可以看这个有趣的网站
  • stride 步长是指filter的扫描图像时,要走的步之间的间隔
  • channels通道指图像的色彩通道一般有RGB三色,这时的卷积后的特征图需要进行相乘后进行相乘后输出,下图为示意图
    ps:RELIU是激发层
    原图参见参考3

在这里,训练CNN在相当意义上是在训练每一个卷积层的滤波器,让这些滤波器组对特定的模式有高的激活,以达到CNN网络的分类/检测等目的

另外卷积神经网络的往往第一个卷积层的滤波器用来检测低阶特征,比如边、角、曲线等。随着卷积层的增加,对应滤波器检测的特征就更加复杂.比如第二个卷积层的输入实际上是第一层的输出(滤波器激活图),这一层的滤波器便是用来检测低价特征的组合等情况(半圆、四边形等),如此累积,以检测越来越复杂的特征。实际上,我们的人类大脑的视觉信息处理也遵循这样的低阶特征到高阶特征的模式

池化层

池化层是模仿人的视觉系统对数据进行降维,用更高层次的特征表示图像
池化层接收上面卷积层的数据,一般进行数据的降维处理.以实现降低信息冗余,提升模型的尺度不变性,旋转不变性和防止过拟合.

池化层的常用方法

  • 最大值池化,在前向过程,选择图像区域中的最大值作为该区域池化后的值;在后向过程中,梯度通过前向过程时的最大值反向传播,其他位置的梯度为0
  • 均值池化,在前向传播过程中,计算图像区域中的均值作为该区域池化后的值;在反向传播过程中,梯度特征分均配到各个位置
  • 随机池化,只需对特征区域元素按照其概率值大小随机选择,元素值大的被选中的概率也大。随机位置池化则集成了随机池化与最大值池化两者
  • 组合池化,同时利用最大值池化与均值池化两种的优势而引申的一种池化策略.

全连接层

作用是将分布式特征映射到样本标记空间
卷积取的是局部特征,全连接就是把以前的局部特征重新通过权值矩阵组装成完整的图.因为用到了所有的局部特征,所有叫全连接
全连接层在整个卷积神经网络中起到“分类器”的作用
卷积层、池化层和激活函数层等操作是将原始数据映射到"隐层特征空间",全连接层则将“分布式特征表示”映射到样本标记空间的作用

大致写一下,更多的是感性的理解.
参考1知乎
参考2知乎
参考3知乎
参考4知乎
参考5知乎

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值