上一章节我们讲述了对手写数字识别的网络设计,我们并没有使用卷积神经网络,但是也得到了一个不错的准确率,那我们试想一下,如果将卷积神经网络应用于数字识别,那效果会不会更好呢?好,我们这一节将讲述第一个经典的卷积神经网络,它的名字叫做LeNet-5.
LeNet-5卷积网络模型的结构
LeNet-5 是一个专为手写数字识别而设计的最经典的卷积神经网络,被誉为早期卷积神经网络中最有代表性的实验系统之一。LeNet-5 模型由Yann LeCun 教授于 1998 年在其论文《Gradient-Based Learning Appliedto Document Recognition》中提出,这篇论文对于现代卷积神经网络的研究仍具有指导意义,可以说是CNN领域的第一篇经典之作。在MNIST数据集上, Lel、Jet-5 模型可以达到大约99.4%的准确率,基于 此神经网络模型而设计出的手写数字识别系统在 20 世纪 90年代被广泛应用 于美国的多家银行进行支票手写字识别。根据 Yann LeCun 教授公开发表的论文的内容,可知 LeNet-5 模型共有8 层(包括输入层和输出层),下图展示了LeNet-5模型的整体框架结构。
输入:32*32的手写字体图片,这些手写字体包含0~9数字,也就是相当于10个类别的图片
输出:分类结果,0~9之间的一个数
因此我们可以知道,这是一个多分类问题,总共有十个类,因此神经网络的最后输出层必然是SoftMax问题,然后神经元的个数是10个。
输入层