CNN卷积神经网络--反向传播（3，Notes on Convolutional Neural Networks）

最新推荐文章于 2024-07-28 03:59:40 发布

置顶

xqp_dream

最新推荐文章于 2024-07-28 03:59:40 发布

阅读量6.8k

点赞数 3

分类专栏： deep learning 文章标签： deeplearning

本文链接：https://blog.csdn.net/ck1798333105/article/details/52368031

版权

本文详细介绍了CNN的反向传播算法，包括全连接网络的反向传播、卷积层和子采样层的权值更新，并探讨了如何自动学习特征地图的组合，以及在MATLAB中实现CNN训练的优化技巧。内容涵盖误差反向传播、权重更新、卷积层和子采样层的梯度计算，以及稀疏组合学习。

摘要由CSDN通过智能技术生成

一、介绍

这个文档讨论的是CNNs的推导和实现。CNN架构的连接比权值要多很多，这实际上就隐含着实现了某种形式的规则化。这种特别的网络假定了我们希望通过数据驱动的方式学习到一些滤波器，作为提取输入的特征的一种方法。

本文中，我们先对训练全连接网络的经典BP算法做一个描述，然后推导2D CNN网络的卷积层和子采样层的BP权值更新方法。在推导过程中，我们更强调实现的效率，所以会给出一些Matlab代码。最后，我们转向讨论如何自动地学习组合前一层的特征maps，特别地，我们还学习特征maps的稀疏组合。

二、全连接的反向传播算法

典型的CNN中，开始几层都是卷积和下采样的交替，然后在最后一些层（靠近输出层的），都是全连接的一维网络。这时候我们已经将所有两维2D的特征maps转化为全连接的一维网络的输入。这样，当你准备好将最终的2D特征maps输入到1D网络中时，一个非常方便的方法就是把所有输出的特征maps连接成一个长的输入向量。然后我们回到BP算法的讨论。（更详细的基础推导可以参考UFLDL中“反向传导算法”）。