LeNet模型详解以及代码实现

最新推荐文章于 2024-07-23 09:14:18 发布

One2332x

最新推荐文章于 2024-07-23 09:14:18 发布

阅读量1.6w

点赞数 19

文章标签： keras 计算机视觉深度学习

本文链接：https://blog.csdn.net/One2332x/article/details/121352108

版权

本文深入探讨了卷积神经网络的基础组件，包括输入层、卷积层、激活函数、池化层和全连接层。接着，详细介绍了LeNet-5模型，包括其结构和参数，并给出了代码实现示例。

摘要由CSDN通过智能技术生成

LeNet模型详解以及代码实现

一、卷积神经网络的构成
二、 LeNet-5详解及代码实现
- 1. LeNet模型详解
- 2. 代码实现
三、参考资料

一、卷积神经网络的构成

卷积神经网络图

输入层

整个网络的输入，一般代表了一张图片的像素矩阵。上图中最左侧三维矩阵代表一张输入的图片，三维矩阵的长、宽代表了图像的大小，而三维矩阵的深度代表了图像的色彩通道（channel）。黑白图片的深度为 1，RGB 色彩模式下，图片的深度为 3。

卷积层

CNN 中最为重要的部分。与全连接层不同，卷积层中每一个节点的输入只是上一层神经网络中的一小块，这个小块常用的大小有 3×3 或者 5×5。一般来说，通过卷积层处理过的节点矩阵会变的更深。
卷积层的计算：
在这个卷积层，有两个关键操作：
（1）局部关联：每个神经元看做一个滤波器(filter)
（2）窗口(receptive field)滑动： filter对局部数据计算
先介绍卷积层中遇到的几个名词：
深度（depth）：如下图所示
在这里插入图片描述
步长（stride）：滑动窗口每次移动的长度
填充值（padding）：
举个例子，有一个5 * 5的图片，我们滑动窗口为2 * 2，步长取2，发现还有一个像素没法滑动，如下图。

我们可以在原有的矩阵填充一层，使其变成6 * 6的矩阵，如下图，这时滑动窗口就可以把所有像素遍历完。
在这里插入图片描述
卷积操作:

特征图的边长公式为： $N = (W - F + 2 P) / S + 1$
其中，W是输入的图像，F是卷积核大小，P是填充值，S是步长。

激活函数

-激活函数层的作用是协助卷积层表达复杂的特征。卷积神经网络通常使用线性整流单元（Rectified Linear Unit, ReLU），其它类似ReLU的变体包括有斜率的ReLU（Leaky ReLU, LReLU）、参数化的ReLU（Parametric ReLU, PReLU）、随机化的ReLU（Randomized ReLU, RReLU）、指数线性单元（Exponential Linear Unit, ELU）等。在ReLU出现以前，Sigmoid函数和双曲正切函数（hyperbolic tangent）是常用的激励函数。如下图。
在这里插入图片描述

池化层（Pooling）

池化层不改变三维矩阵的深度，但是可以缩小矩阵的大小。池化操作可以认为是将一张分辨率高的图片转化为分辨率较低的图片。通过池化层，可以进一步缩小最后全连接层中节点的个数，从而到达减少整个神经网络参数的目的。池化层本身没有可以训练的参数。
最大池化是指把卷积后函数区域内元素的最大值作为函数输出的结果，对输入图像提取局部最大响应，选取最显著的特征。平均池化是指把卷积后函数区域内元素的算法平均值作为函数输出结果，对输入图像提取局部响应的均值。如下图。
在这里插入图片描述

全连接层

经过多轮卷积层和池化层的处理后，在CNN的最后一般由1到2个全连接层来给出最后的分类结果。经过几轮卷积和池化操作，可以认为图像中的信息已经被抽象成了信息含量更高的特征。我们可以将卷积和池化看成自动图像提取的过程，在特征提取完成后，仍然需要使用全连接层来完成分类任务。
对于多分类问题，最后一层激活函数可以选择 softmax，这样我们可以得到样本属于各个类别的概率分布情况。