CNN图像分类模型(一)——LeNet
一)简介
LeNet-5是一种用于手写体字符识别的非常高效的卷积神经网络,自论文Gradient-Based Learning Applied to Document Recognition,由Yann LeCun等人于1998年发表。LeNet模型虽然结构相对简单,但包含了深度学习的基本模块——卷积层,池化层,全链接层,是后续各类CNN识别模型的基础。
二)LeNet模型简介
LeNet-5网络结构
如图所示为LeNet-5网络的基本结构,一共由7层(不包含输入层):
0)输入层——32x32尺寸图像
1)C1——卷积层1
2)S2——池化层1
3)C3——卷积层2
4)S4——池化层2
5)C5——全连接层1
6)F6——全连接层2
7)输出层——全连接层2
2.1)输入图像
首先是图像输入层,输入灰度图像的尺寸归一化为32*32像素。
2.2)卷积层C1
卷积核大小:5x5(卷积核每次滑动一个像素,即stride=1)