Andrew Ng Deep Learning 第三周 双层神经网络反向传播 公式推导

在这里插入图片描述
在这里插入图片描述
在学这部分内容时,并不能理解 d z [ 1 ] = W [ 2 ] T d z [ 2 ] ∗ g [ 1 ] ′ ( z [ 1 ] ) dz^{[1]} =W^{[2]T}dz^{[2]}*g^{[1]'}(z^{[1]}) dz[1]=W[2]Tdz[2]g[1](z[1])是怎么推导的
其实就是简单的利用链式法则
还有一点就是当时没有注意 x 和 a x和a xa
推导如下:
d z [ 1 ] = d L d z [ 1 ] = d L d z [ 2 ] ⋅ d z [ 2 ] d z [ 1 ] = d L d z [ 2 ] ⋅ d z [ 2 ] d a [ 1 ] ⋅ d a [ 1 ] d z [ 1 ] dz^{[1]}=\frac{dL}{dz^{[1]}}=\frac{dL}{dz^{[2]}}\cdot\frac{dz^{[2]}}{dz^{[1]}}=\frac{dL}{dz^{[2]}}\cdot\frac{dz^{[2]}}{da^{[1]}}\cdot\frac{da^{[1]}}{dz^{[1]}} dz[1]=dz[1]dL=dz[2]dLdz[1]dz[2]=dz[2]dLda[1]dz[2]dz[1]da[1](chain rule)

d L d z [ 2 ] = d z [ 2 ] \frac{dL}{dz^{[2]}}=dz^{[2]} dz[2]dL=dz[2]

d z [ 2 ] d a [ 1 ] = W [ 2 ] T \frac{dz^{[2]}}{da^[1]}=W^{[2]T} da[1]dz[2]=W[2]T当时主要就是这一步没有理解

图上 Z [ 2 ] = W [ 2 ] x + b [ 2 ] Z^{[2]}=W^{[2]}x+b^{[2]} Z[2]=W[2]x+b[2],其实这里的第二层输入的x,就是 a [ 1 ] a^{[1]} a[1]

Z [ 2 ] = W [ 2 ] a [ 1 ] + b [ 2 ] Z^{[2]}=W^{[2]}a^{[1]}+b^{[2]} Z[2]=W[2]a[1]+b[2],这么看的话结果显然是 W [ 2 ] W^{[2]} W[2]

但最后的结果还多一个转置,则是为了矩阵维度匹配

d a [ 1 ] d z [ 1 ] = g [ 1 ] ′ ( z [ 1 ] ) \frac{da^{[1]}}{dz^{[1]}}=g^{[1]'}(z^{[1]}) dz[1]da[1]=g[1](z[1]) 这是隐藏层所用激活函数的导数的写法

综上 d z [ 1 ] = d L d z [ 1 ] = d L d z [ 2 ] ⋅ d z [ 2 ] d z [ 1 ] = d L d z [ 2 ] ⋅ d z [ 2 ] d a [ 1 ] ⋅ d a [ 1 ] d z [ 1 ] dz^{[1]}=\frac{dL}{dz^{[1]}}=\frac{dL}{dz^{[2]}}\cdot\frac{dz^{[2]}}{dz^{[1]}}=\frac{dL}{dz^{[2]}}\cdot\frac{dz^{[2]}}{da^{[1]}}\cdot\frac{da^{[1]}}{dz^{[1]}} dz[1]=dz[1]dL=dz[2]dLdz[1]dz[2]=dz[2]dLda[1]dz[2]dz[1]da[1]

= W [ 2 ] T d z [ 2 ] ∗ g [ 1 ] ′ ( z [ 1 ] ) =W^{[2]T}dz^{[2]}*g^{[1]'}(z^{[1]}) =W[2]Tdz[2]g[1](z[1])

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值