卷积神经网络反向传播理论推导

最新推荐文章于 2025-04-16 09:00:00 发布

Hearthougan

最新推荐文章于 2025-04-16 09:00:00 发布

阅读量1.7w

点赞数 20

本文链接：https://blog.csdn.net/hearthougan/article/details/72910223

版权

Machine Learning 同时被 2 个专栏收录

28 篇文章

订阅专栏

Deep Learning

14 篇文章

订阅专栏

本文深入探讨了卷积神经网络(CNN)的反向传播过程，重点解释了卷积层和池化层的误差传播机制，包括卷积核翻转的原因及如何处理不同尺度特征图间的误差传递。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文首先简单介绍CNN的结构，并不作详细介绍，若需要了解推荐看CS231n课程笔记翻译：卷积神经网络笔记。本文只要讲解CNN的反向传播，CNN的反向传播，其实并不是大多所说的和全连接的BP类似，CNN的全连接部分的BP是与它相同，但是CNN中卷积--池化、池化--卷积部分的BP是不一样的，仔细推导，还是有很多细节地方需要思考的，比如1、在前向传播的过程中，卷积层的输入，是通过卷积核与前一层的输出特征图卷积得来的，那么在反向传播的过程中该怎么处理？这个就与全连接神经网络不同了。2、由于在前向传播的时候，池化层会对前一层卷积层进行放缩，那么从池化层到卷积层BP的时候，小尺度的池化层怎么把误差反传到大尺度的卷积层（这里的大小是一般而言，卷积层一张特征图经池化之后尺度会变小）？这个就与全连接神经网络完全不同！3、公式推导中，或者某些库的函数实现过程中，卷积核为什么要翻转180度？ps.本文是根据汇报的PPT更改，里面有很多图和文字就直接截图了，里面的每一个公式都是我和F.Tao讨论和推导过的，如有错误欢迎指正。

还是先首先贴一张CNN结构图吧，下面这张图个人认为是结构很清晰的，每一层是什么，以及卷积层+池化层和全连接层在做什么工作都表达的很好，来源Google搜索。

要明白卷积操作是用来干嘛的，是用来提取特征的，反向传播的意义又是什么？因为初始的时候卷积核的值都是随机设定的，我们可以根据前向传播的预测结果，进行误差分析，不断地修改卷积核的值，使得更好的提取特征，就是反向传播的意义。