卷积神经网络概述

最新推荐文章于 2024-03-21 04:46:35 发布

Shawn_gj

最新推荐文章于 2024-03-21 04:46:35 发布

阅读量1.8k

点赞数 1

分类专栏： Pytorch

本文链接：https://blog.csdn.net/qq_36909245/article/details/104380251

版权

Pytorch 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

本人小白，学习中有什么问题可以指出

卷积神经网络是什么？

卷积神经网络（Convolutional Neural Networks, CNN）是一类包含卷积计算且具有深度结构的前馈神经网络，是多层感知机（MLP）的变种，本质是一个多层感知机，但由于其采用了局部连接和权值共享的方式，一方面减少了权值数量使得网络易于优化，另一方面也降低了模型的复杂度，减少了过拟合的风险。卷积神经网络在输入图像时，优势表现的更为明显，其可以使图像直接作为网络的输入，避免了传统识别算法中复杂的特征提取及数据重建的过程，在二维图像的处理过程中有很大的优势，如网络能够自行抽取图像的特征包括颜色、纹理、形状及图像的拓扑结构，在处理二维图像的问题上，特别是识别位移、缩放及其他形式扭曲不变性的应用上具有良好的鲁棒性和运算效率等。

卷积神经网络的结构：

卷积神经网络总体由输入层、隐含层、输出层构成，隐含层则主要由卷积层、池化层、全连接层等构成，其大致组成如上图。

卷积层：

通过卷积运算我们可以提取出图像的特征，通过卷积运算可以使得原始信号的某些特征增强，并且降低噪声，卷积运算大致如下图所示。

图中左边的是输入的图像（5×5），中间是卷积核（3×3），右边是卷积的结果（3×3）。运算时将卷积核从图像的左上角开始，从左到右从上到下，依次进行步长为1的卷积，具体卷积运算是将卷积核内的系数乘上图像对应位置的数值，然后将所有数值累加，得到特征图某一像素的值。例如图中的155=(-1)×0+(-2)×0+(-1)×75+0×0+0×75+0×80+1×0 +2×75+1×80。从图中我们可以看出来，单纯的进行卷积的话会使图片尺寸变小，因此为减少图像特征的损失，我们通常会对输入的图像进行填充，填充数值通常为0或重复边界填充。假设输入的图像尺寸为l，对于某一边的填充层数为p，卷积核大小为f，步长为 w，输出的图像尺寸为L，那么：

L=（l+2×p-f）÷w+1

一般而言，为保证提取特征的效果，我们在卷积的时候不会改变特征图的大小，及宽和高不变。

池化层：

池化层一般是在尽可能保证特征不损失的情况下，缩小特征图的大小的所进行的操作，通常进行的池化分为最大池化和均值池化，一般而言，均值池化能减小因邻域大小受限而造成的估计值方差增大而产生的误差，从而保留图像的背景信息，最大池化则能减小银卷积层参数误差造成估计均值的偏移而产生的误差，从而更多的保留纹理信息。上图是4×4的图像进行2×2、步长为2的池化后的结果。

全连接层：

卷积神经网络中的全连接层等价于传统前馈神经网络中的隐含层。全连接层通常搭建在卷积神经网络隐含层的最后部分，并只向其它全连接层传递信号。特征图在全连接层中会失去3维结构，被展开为向量并通过激励函数传递至下一层。在一些卷积神经网络中，全连接层的功能可部分由全局均值池化（global average pooling）取代，全局均值池化会将特征图每个通道的所有值取平均，即若有7×7×256的特征图，全局均值池化将返回一个256的向量，其中每个元素都是7×7，步长为7，无填充的均值池化。

激励函数：

以前常用的激励函数是Sigmoid函数和tanh函数，不过近年来在卷积神经网络中较为常用的是ReLu（线性整流）函数，使用ReLu和之前的sigmoid函数作用是一样的，不过ReLu的收敛速度会比其他两个快很多，而且更容易学习优化，因其分段线性的特性，使得其前传后传求导都是分段线性的，在一定程度上缓解了梯度消失和过拟合的问题，在深层网络训练时，tanh和sigmoid都会在端值趋于饱和，造成训练速度过慢，因此常默认采用ReLu函数。不过ReLu函数会有死亡问题，其主要原因是学习率过大，使得输入数据在过神经元的时候输出值小于0了，然后再过ReLu就没效果了，因此要注意学习率不能过大。

卷积神经网络的训练过程：

CNN在本质上是一种输入到输出的映射，它能够学习大量的输入与输出之间的映射关系，而不需要任何输入和输出之间的精确的数学表达式，只要用已知的模式对卷积网络加以训练，网络就具有输入输出对之间的映射能力。卷积网络执行的是监督训练，所以其样本集是由形如：（输入向量，理想输出向量）的向量对构成的。所有这些向量对，都应该是来源于网络即将模拟系统的实际“运行”结构，它们可以是从实际运行系统中采集来。

1）参数初始化：在开始训练前，所有的权都应该用一些不同的随机数进行初始化。“小随机数”用来保证网络不会因权值过大而进入饱和状态，从而导致训练失败；“不同”用来保证网络可以正常地学习。实际上，如果用相同的数去初始化权矩阵，则网络无学习能力。

2）训练过程包括四步 ① 第一阶段：前向传播阶段 i 从样本集中取一个样本，输入网络 ii 计算相应的实际输出；在此阶段信息从输入层经过逐级的变换，传送到输出层，这个过程也是网络在完成训练之后正常执行时执行的过程 ② 第二阶段：后向传播阶段 iii 计算实际输出与相应的理想输出的差 iv 按照极小化误差的方法调整权值矩阵整个网络的具体训练步骤：

1、选定训练组，从样本集中分别随机地寻求N个样本作为训练组；

2、将各权值、阈值，置成小的接近于0的随机值，并初始化精度控制参数和学习率；

3、从训练组中取一个输入模式加到网络，并给出它的目标输出向量；

4、计算出中间层输出向量，计算出网络的实际输出向量；

5、将输出向量中的元素与目标向量中的元素进行比较，计算出输出误差；对于中间层的隐单元也需要计算出误差；

6、依次计算出各权值的调整量和阈值的调整量；

7、调整权值和调整阈值；

8、当经历M后，判断指标是否满足精度要求，如果不满足，则返回(3)，继续迭代；如果满足就进入下一步；

9、训练结束，将权值和阈值保存在文件中。这时可以认为各个权值已经达到稳定，分类器已经形成。再一次进行训练，直接从文件导出权值和阈值进行训练，不需要进行初始化。

Shawn_gj

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
卷积神经网络概述

本人小白，学习中有什么问题可以指出卷积神经网络是什么？卷积神经网络（Convolutional Neural Networks, CNN）是一类包含卷积计算且具有深度结构的前馈神经网络，是多层感知机（MLP）的变种，本质是一个多层感知机，但由于其采用了局部连接和权值共享的方式，一方面减少了权值数量使得网络易于优化，另一方面也降低了模型的复杂度，减少了过拟合的风险。卷积神经网络在输入...
复制链接

扫一扫

专栏目录