深度学习-卷积神经网络的结构&经典网络介绍

卷积神经网络的结构

总体结构

通产情况下,卷积神经网络由若干个卷积层、激活层、池化层、以及全连接层构成。
在这里插入图片描述

卷积层

卷积层是 卷积神经网络的核心所在,通过卷积运算可以达到提取特征和降维处理两个重要的目的。
在这里插入图片描述

激活层

作用是将前一层的线性输出,通过非线性的激活函数进行处理,这样用于模拟任意函数,从而增强网络的表表征能力。在深度学习领域,ReLU(修正线性单元)是目前使用较多的激活函数,主要原因是它收敛更快,同时它还解决了梯度消失的为问题。

池化层

池化层也称为子采样或者下采样,目的是缩小高、长方向上的空间的运算,以降低计算量,提高泛化能力。如下图所示,将44的矩阵缩小成22的矩阵的输出。

在这里插入图片描述

池化层的计算
  • 对于每个输入矩阵,我们将其切割成若干大小相等的正方形小块,对于每一个区块取最大值或者平均值,并将结果组成一个新的矩阵。
  • Max池化:对各个参与池化计算的区域取最大值,形成新军阵。在图像识别领域主要使用Max池化。
  • Average池化:对各个参与池化计算的区域计算平均值
池化层的特征
  • 没有要学习的参数池化层和卷积层不同,没有要学习的参数。池化只是层目标区域中取最大值(或者平均值),所以不存在要学习的参数。
  • 通道数不发生变化经过池化运算,输入数据和输出数据的通道数不会发生变化。
    在这里插入图片描述
    **对微小的位置变化具有鲁棒性(健壮)。**输入数据发生微小偏差时,池化仍会返回相同的结果。

全连接层

  • 这个网络相当于多层感知机,其在整个神经网络中起到分类器的作用。
  • 通过前面的多个‘卷积-激活-池化’层的反复处理,待处理的数据特性已有了显著的提高:一方面,输入数据的维度已下降到可用传统前馈全连接网络来处理了;另一方面,此时的全连接层输入的数据已经很精简,因此输出的分类品质要高得多。

经典神经网络介绍

LeNet

LeNet是 Yann LeCun在1998年提出,用于解决手写数字识别的视觉任务。自那时起,CNN的最基本的架构就定下来了:卷积层、池化层、全连接层。
在这里插入图片描述
LeNet:主要参数:

  • 输入:输入32*32大小单通道图像
  • 两个“卷积-池化层”
  • 第一个全连接层神经元数目为500,再接激活函数
  • 第二个全连接层神经元数目为10,得到10维的特征向量,用于10个数字的分 类训练,送入softmaxt分类,得到分类结果的概率

AlexNet

AlexNet是2012年ImageNet竞赛冠军获得者Hinton和他的学生Alex Krizhevsky设计的, 把CNN的基本原理应用到了很深很宽的网络中。其特点有:

  • 使用ReLU作为激活函数,并验证其效果在较深的网络超过了Sigmoid,成功解决了Sigmoid在网络较深 时的梯度弥散问题
  • 使用Dropout(丢弃学习)随机忽略一部分神经元防止过拟合
  • 在CNN中使用重叠的最大池化。此前CNN中普遍使用平均池化,AlexNet全部使用最大池化,避免平均 池化的模糊化效果
  • 提出了LRN(Local Response Normalization,局部正规化)层,对局部神经元的活动创建竞争机制, 使得其中响应比较大的值变得相对更大,并抑制其他反馈较小的神经元,增强了模型的泛化能力
  • 使用CUDA加速深度卷积网络的训练,利用GPU强大的并行计算能力,处理神经网络训练时大量的矩阵 运算

AlexNet网络结构如下:
在这里插入图片描述

AlexNet:主要参数:

  • AlexNet网络包含8层,其中前5层为卷积-池化层,后3层为全连接层;
  • 输入 224×224×3的图像,第一卷积层用96个11×11×3的卷积核对进行滤波,步 幅4像素;
  • 全连接的每层有4096个神经元,最后一个完全连接的层的输出被馈 送到1000路SoftMax,它产生超过1000个类别标签的分布;
  • 整个网络共 650000个神经元

VGG

VGG是Visual Geometry Group, Department of Engineering Science, University of Oxford(牛津大学工程科学系视觉几何组)的缩写,2014年参 加ILSVRC(ImageNet Large Scale Visual Recognition Challenge) 2014大 赛获得亚军(当年冠军为GoogLeNet,但因为VGG结构简单,应用性强,所以 很多技术人员都喜欢使用基于VGG的网络)
在这里插入图片描述

VGG:主要参数:

  • 网络深度:16~19层
  • 5组卷积-池化层,3个全连接层
  • 三个全连接层,前两层都有4096通道, 第三层共1000路及代表1000个标签类 别;最后一层为softmax层
  • 所有卷积层有相同的配置,即卷积核大 小为3x3,步长为1,填充为1
  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值