卷积神经网络反向传播理论推导

最新推荐文章于 2024-04-03 09:03:36 发布

方式四个

最新推荐文章于 2024-04-03 09:03:36 发布

阅读量118

点赞数

本文链接：https://blog.csdn.net/qq_45078907/article/details/90449040

版权

本文深入探讨卷积神经网络（CNN）的反向传播机制，指出其与全连接神经网络的区别，特别是卷积层与池化层之间的误差传递问题。作者详细推导了卷积核的调整过程，并解释了反向传播在优化特征提取中的作用。同时，文中提供了清晰的CNN结构图以帮助理解各层的功能。

摘要由CSDN通过智能技术生成

本文首先简单介绍CNN的结构，并不作详细介绍，本文只要讲解CNN的反向传播，CNN的反向传播，其实并不是大多所说的和全连接的BP类似，CNN的全连接部分的BP是与它相同，但是CNN中卷积--池化、池化--卷积部分的BP是不一样的，仔细推导，还是有很多细节地方需要思考的，比如1、在前向传播的过程中，卷积层的输入，是通过卷积核与前一层的输出特征图卷积得来的，那么在反向传播的过程中该怎么处理？这个就与全连接神经网络不同了。2、由于在前向传播的时候，池化层会对前一层卷积层进行放缩，那么从池化层到卷积层BP的时候，小尺度的池化层怎么把误差反传到大尺度的卷积层（这里的大小是一般而言，卷积层一张特征图经池化之后尺度会变小）？这个就与全连接神经网络完全不同！3、公式推导中，或者某些库的函数实现过程中，卷积核为什么要翻转180度？ps.本文是根据汇报的PPT更改，里面有很多图和文字就直接截图了，里面的每一个公式都是我和F.Tao讨论和推导过的，如有错误欢迎指正。

还是先首先贴一张CNN结构图吧，下面这张图个人认为是结构很清晰的，每一层是什么，以及卷积层+池化层和全连接层在做什么工作都表达的很好，来源Google搜索。

要明白卷积操作是用来干嘛的，是用来提取特征的，反向传播的意义又是什么？因为初始的时候卷积核的值都是随机设定的，我们可以根据前向传播的预测结果，进行误差分析，不断地修改卷积核的值，使得更好的提取特征，就是反向传播的意义。

如果你觉得这篇文章看起来稍微还有些吃力，或者想要系统地学习人工智能，那么推荐你去看床长人工智能教程。非常棒的大神之作，教程不仅通俗易懂，而且很风趣幽默。点击这里可以查看教程。