cs231n笔记--到底什么是梯度消散

这篇博客通过分析一个简单的神经元block,解释了梯度消散现象。在前向传播中,输入与权重相乘,而在后向传播中,由于权重较小,导致从下一层网络传回的梯度显著减小,这在深层网络中尤为明显,限制了浅层网络参数的训练,使得在Resnet出现前,CNN网络的层数通常不超过20层。
摘要由CSDN通过智能技术生成

笔记来自 CS231n Winter 2016: Lecture 4: Backpropagation, Neural Networks 内容

地址为:http://www.microsofttranslator.com/bv.aspx?ref=SERP&br=ro&mkt=zh-CN&dl=zh&lp=EN_ZH-CHS&a=http%3a%2f%2fcs231n.stanford.edu%2fsyllabus.html
如果你被墙了,去bilibili找


当梯度传播到中间层的神经元f时,如图上图所示,来自上一层的梯度dLdz从右边z进入,传到中间的神经元。此神经元在左边有两个输入,分别是x和y,为了计算L对于x和y的梯度dLdx和dLdy,就必须先计算dzdx和dzdy,根据复合函数求导公式,dLdx = dLdz * dzdx,dLdy = dLdz * dzdy,这样就能算出传播到x和y的梯度了。也就是说通过这个方法,来自深一层的梯度就能传播到x和y当中。

让我们来考虑

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值