LeNet5
LeNet-5是一个简单地卷积神经网络,可以通过LeNet-5模型来实现MNIST手写体的识别。
LeNet-5模型大致上有两层卷积层,两层池化层,两层全连接层。
操作流程:
1)输入层:输入一张图像(手写体识别的图像一般是黑白的,图像只有单通道),对这张图片先进行数据预处理,使图片的尺寸统一为32x32大小(当然其他大小也可,但图片尺寸不可过大或过小,导致卷积核无法完全提取图像特征,造成最后结果的一定偏差);
2)卷积层:将输入的图片经过卷积核(滤波器)来提取特征,每一种卷积核可以提取出图片上不同的特征。一般卷积出来的图像数据要进行一次激活,为神经元引入非线性因素,使得神经网络可以任意逼近任何非线性函数;
3)池化层:将经过一次卷积提取特征后的特征图传入池化层中,在池化层中一般有两种操作——最大池化与平均池化。通过池化层可以压缩图片,将图片中无关紧要的特征剔除;
4)卷积层:第二次用卷积核提取特征,获得特征图;
5)池化层:对卷积层输出的结果进行采样,压缩图像尺寸大小;
6)卷积层:将上一层的所有特征图用卷积核进行展开,最后得到的结果为一个一维的向量,