反向传播公式推导记录

1

第l层第j个神经元上的误差 δ j l \delta_j^l δjl
δ j l ≡ ∂ C ∂ z j l \delta_j^l\equiv\frac{\partial{C}}{\partial{z_j^l}} δjlzjlC

δ j L = ∂ C ∂ a j L σ ′ ( z j L ) a j L = σ ( z j L ) z j L = ∑ k w j k L a k L − 1 + b j L \delta_j^L = \frac{\partial{C}}{\partial{a_j^L}}\sigma'(z_j^L)\\ a_j^L = \sigma(z_j^L)\\ z_j^L = \sum_k{w_{jk}^La_k^{L-1}}+b_j^L δjL=ajLCσ(zjL)ajL=σ(zjL)zjL=kwjkLakL1+bjL

δ L = ∇ a C ⊙ σ ′ ( z L ) \delta^L=\nabla_aC\odot\sigma'(z^L) δL=aCσ(zL)

此处 ⊙ \odot 表示矩阵对应位置相乘

在这里插入图片描述

2

误差反向传播 δ l 、 δ l + 1 \delta^l、\delta^{l+1} δlδl+1之间的关系
δ l = ( ( w l + 1 ) T δ l + 1 ) ⊙ σ ′ ( z l ) z k l + 1 = ∑ j w k j l + 1 a j l + b k l + 1 = ∑ j w k j l + 1 σ ( z j l ) + b k l + 1 ∂ z k l + 1 ∂ z j l = w k j l + 1 σ ′ ( z j l ) δ j l = ∂ C ∂ z j l = ∑ k ∂ C ∂ z k l + 1 ∂ z k l + 1 ∂ z j l = ∑ k ∂ z k l + 1 ∂ z j l δ k l + 1 = ∑ k w k j l + 1 δ k l + 1 σ ′ ( z j l ) \delta^l=((w^{l+1})^T\delta^{l+1})\odot\sigma'(z^l)\\ z_k^{l+1}=\sum_jw_{kj}^{l+1}a_j^l+b_k^{l+1}=\sum_jw_{kj}^{l+1}\sigma(z_j^l)+b_k^{l+1}\\ \frac{\partial z_k^{l+1}}{\partial z_j^l}=w_{kj}^{l+1}\sigma'(z_j^l) \\ \delta_j^l=\frac{\partial{C}}{\partial z_j^l}=\sum_k{\frac{\partial C}{\partial z_k^{l+1}}\frac{\partial z_k^{l+1}}{\partial z_j^l}}=\sum_k{\frac{\partial z_k^{l+1}}{\partial z_j^l}\delta_k^{l+1}}\\=\sum_kw_{kj}^{l+1}\delta_k^{l+1}\sigma'(z_j^l) δl=((wl+1)Tδl+1)σ(zl)zkl+1=jwkjl+1ajl+bkl+1=jwkjl+1σ(zjl)+bkl+1zjlzkl+1=wkjl+1σ(zjl)δjl=zjlC=kzkl+1Czjlzkl+1=kzjlzkl+1δkl+1=kwkjl+1δkl+1σ(zjl)

在这里插入图片描述

3

∂ C ∂ b j l = δ j l ∂ C ∂ z j l = δ j l z j l = ∑ k w j k l a k l − 1 + b j l ∂ z j l ∂ b j l = 1 \frac{\partial C}{\partial b_j^l}=\delta_j^l\\ \frac{\partial C}{\partial z_j^l}=\delta_j^l\\ z_j^l=\sum_kw_{jk}^la_k^{l-1}+b_j^l\\ \frac{\partial z_j^l}{\partial b_j^l} = 1 bjlC=δjlzjlC=δjlzjl=kwjklakl1+bjlbjlzjl=1

4

∂ C ∂ w j k l = a k l − 1 δ j l ∂ C ∂ w l = δ l ( a l − 1 ) T ∂ z j l ∂ w j k l = a k l − 1 \frac{\partial C}{\partial w_{jk}^l}=a_k^{l-1}\delta_j^l\\ \frac{\partial C}{\partial w^l}=\delta^l(a^{l-1})^T\\ \frac{\partial z_j^l}{\partial w_{jk}^l}=a_k^{l-1} wjklC=akl1δjlwlC=δl(al1)Twjklzjl=akl1

在这里插入图片描述

5、反向传播过程

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值