吴恩达课程-直观连接反向传播-个人理解

        在课程中吴恩达解释了反向传播求导时,下面三个式子的来源,但我觉的不直观

dz^{[]2]}=a^{[2]]}-y

        首先说一下这个,根据链式法则,下图中,L(a^{[2]},y)对a求导,然后用da来表示求导的结果, 用g{}'(z)代表\sigma(z^{[2]})z^{[2]}的求导结果,那么L(a^{[2]},y)z^{[2]}的求导就是da乘以g{}'(z)

dz=da\cdot g{}'(z)

         然后

L(a,y)=-yloga-(1-y)log(1-a)

\frac{dL(a,y)}{da}=\frac{1-y}{1-a}-\frac{y}{a}

g(z)=sigmoid(z)=\frac{1}{1+e^{-z}}

g{}'(z)=\frac{1}{1+e^{-z}}(1-\frac{1}{1+e^{-z}})=g(z)(1-g(z))

dz = da\cdot g{}'(z)=(\frac{1-y}{1-a}-\frac{y}{a})(1-a)a=a-y

 

        而为什么a^{[2]}要有转置a^{[2]T},我的理解是dz^{[2]}=a^{[2]}-y,我们先略去y,然后 

         可以看到a^{[2]}a^{[1]}都是n行m列的矩阵,肯定不能相乘的,只能把a^{[1]}转置才能和a^{[2]}

相乘 。

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值