Python TensorFlow，卷积神经网络(CNN)，手动实现卷积神经网络

最新推荐文章于 2024-08-06 13:51:11 发布

houyanhua1

最新推荐文章于 2024-08-06 13:51:11 发布

阅读量3.5k

点赞数 6

分类专栏： Python+ 机器学习文章标签： Python TensorFlow 卷积神经网络 CNN

本文链接：https://blog.csdn.net/houyanhua1/article/details/88315728

版权

本文介绍了卷积神经网络（CNN）的结构，包括卷积层、激活函数、池化层和全连接层，并探讨了为什么使用ReLU而非sigmoid激活函数。通过Python TensorFlow手动实现了一个CNN模型，用于预测手写数字图像。

摘要由CSDN通过智能技术生成

普通的深层神经网络，层与层之间通过全连接进行稠密矩阵运算，矩阵中的权重系数比较多(参数多)，影响效率且容易出现过拟合。

卷积神经网络的结构：卷积层、激活函数、池化层、全连接层。

卷积层：将原始图片通过Filter(过滤器，权重矩阵，卷积核，观察窗口)，分割出局部信息，过滤器经过多次平移取样(步长)形成一个个局部信息然后组成卷积层，卷积层中的每一个单位点对应前面层的局部信息。（卷积的意义：一个点与临近的点联系比较紧密，离得越远的点，联系越不紧密。）。当神经网络中的层数逐渐增加时，卷积层中的局部信息就会逐渐与全局信息产生联系。过滤器大小一般设为3*3或5*5(奇数)，步长1。(卷积核的计算过程：卷积核(权重矩阵)与输入图片的局部矩阵中的像素进行一一对应的线性相乘求和再加偏置得到卷积层中的一个单位值，卷积核进行平移继续得到卷积层中的全部值(2维)。可以有多个卷积核，多个卷积核的观察(计算)结果共同组成卷积层(3维)。如果图片是3通道，那么卷积核也是3通道，3个通道的计算结果再求和加偏置形成卷积层中的单位点(卷积层形状的深度与通道数无关，只与卷积核的数量有关))。

池化层：(下采样、欠采样，特征降维)，减少矩阵的长和宽(也是通过观察窗口的形式实现)，减少参数个数，避免过拟合。分为最大池化层和平均池化层(将观察窗口中的最大值或平均值作为其输出)。池化层中的观察窗口大小一般设为2*2，步长2。（池化层的计算过程：通过观察窗口截取卷积层，截取出的矩阵中的最大值(或平均值)作为池化层中的单位点，观察窗口进行平移形成整个池化层。池化只会减少卷积层形状的长和宽，并不会影响形状的深度）

激活函数：解决非线性划分问题，一般是一个非线性的函数，(神经网络的矩阵运算只是一个线性变化)。

全连接层：前面的卷积和池化相当于做特征工程(并没有进行矩阵乘法，只是一一对应的线性相乘)，后面的全连接相当于做真正的特征加权(矩阵乘法)。最后的全连接层在整个卷积神经网络中起到“分类器”的作用。(如果卷积神经网络不是用于分类问题,那么可以不使用全连接层)