深度学习笔记（3）——CNN中一些特殊环节的反向传播

最新推荐文章于 2025-03-26 11:35:43 发布

迷川浩浩_ZJU

最新推荐文章于 2025-03-26 11:35:43 发布

阅读量2.3w

点赞数 44

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_21190081/article/details/72871704

版权

在深度学习笔记（2）——卷积神经网络（Convolutional Neural Network）
中我们介绍了CNN网络的前向传播，这一篇我们介绍CNN的反向传播，讲到反向传播的时候实质就是一大堆求梯度的数学公式，这些公式其实已经在深度学习笔记（1）——神经网络(neural network)
那篇博客中介绍过了，所以这里就不再介绍。

但是传统的神经网络无论是隐层还是激活函数的导数都是可导，可以直接计算出导数函数，然而在CNN网络中存在一些不可导的特殊环节，比如Relu等不可导的激活函数、造成维数变化的池化采样、已经参数共享的卷积环节。NN网络的反向传播本质就是梯度（可能学术中会用残差这个词，本文的梯度可以认为就是残差）传递，所以只要我们搞懂了这些特殊环节的导数计算，那么我们也就理解CNN的反向传播。

Relu函数的导数计算

先从最简单的开始，Relu激活在高等数学上的定义为连续（局部）不可微的函数，它的公式为

R e l u (x) = {x, 0,

最低0.47元/天解锁文章

评论 13

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。