反向传播算法之要点(Backpropagation Algorithm)

反向传播算法之要点(Backpropagation Algorithm)

Introduction

反向传播是一个很简单的算法,一个学习过微积分的人就能够轻松的理解。本文希望能避免让人打不起精神来看的冗余繁杂,简洁地把反向传播的算法的推导过程和求解过程进行简洁、清晰的表述。

本文目标读者:

大概了解反向传播,但是还没有理解反向传播的公式推导过程。

反向传播的要点只有3个公式,首先在此做总结如下:

  1. 符号解释:
符号 含义
w i j l w_{ij}^l wijl 第l-1层第j个神经元输入到第l层第i个神经元时所要乘的权重
b i l b_i^l bil 第l层第i个神经元的偏置
z i l z^l_i zil 第l层第i个神经元的输入, z i l = ∑ j w i j a j l − 1 + b i l z^l_i=\sum_jw_{ij}a^{l-1}_j+b^l_i zil=jwijajl1+bil
a i l a^l_i ail 第l层第i个神经元的输出, a i l = a c t i v a t i o n ( z i l ) a^l_i=activation(z^l_i) ail=activation(zil)
C C C Cost function
δ i l \delta^l_i δil δ i l = ∂ C ∂ z i l \delta^l_i=\frac {\partial C}{\partial z^l_i} δil=zilC

tips:当没有加上下标的时候,表示一个列向量或矩阵

  1. 3个基本公式

∂ C ∂ w l = δ l ⋅ ( a l − 1 ) T \frac {\partial C}{\partial w^l}= \delta^l \cdot (a^{l-1})^T wlC=δl(al1)T

∂ C ∂ b l = δ l \frac {\partial C}{\partial b^l}=\delta^l blC=δl

δ l = a ′ ( z l ) ⊙ ( ( w l + 1 ) T δ l + 1 ) \delta^{l}=a'(z^l)\odot ((w^{l+1})^T\delta^{l+1}) δl=a(zl)((wl+1)Tδ

  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值