卷积神经网络（一）：LeNet5的基本结构

最新推荐文章于 2025-06-12 14:52:44 发布

置顶

轩辕森

最新推荐文章于 2025-06-12 14:52:44 发布

阅读量9.6w

点赞数 19

CC 4.0 BY-SA版权

分类专栏：深度学习机器学习

本文链接：https://blog.csdn.net/xuanyuansen/article/details/41800721

本文深入探讨卷积神经网络在图像处理中的应用，通过解析LeNet5的基本结构，包括卷积层、池化层的计算原理，以及在Python中实现和优化的步骤。详细介绍了卷积层的参数数量、连接数，以及S2到C3层的复杂连接方式，最后提及了F6层和输出层的激活函数。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在机器视觉，图像处理领域，卷积神经网络取得了巨大的成功。本文将参考UFLDL和DEEPLEARNING.NET的教程，结合自己的理解，梳理一下卷积神经网络的构成以及其BP算法的求解。虽然利用theano可以方便的实现LeNet5，但是不利于学习和理解卷积神经网络，所以最后会自己动手用python实现一个简单的LeNet5，并尝试利用python的PyCUDA库进行加速。

首先看LeNet5的结构，如下图所示（来自Yann LeCun的论文）。

对于卷积层，其计算公式为

其中K表示由L层到L+1层要产生的feature的数量，表示“卷积核”，表示偏置，也就是bias，令卷积核的大小为5*5，总共就有6*（5*5+1）=156个参数，对于卷积层C1，每个像素都与前一层的5*5个像素和1个bias有连接，所以总共有156*28*28=122304个连接（connection）。

对于LeNet5，S2这个pooling层是对C1中的2*2区域内的像素求和再加上一个偏置，然后将这个结果再做一次映射（sigmoid等函数），所以相当于对S1做了降维，此处共有6*2=12个参数。S2中的每个像素都与C1中的2*2个像素和1个偏置相连接，所以有6*5*14*14=588