在课程中吴恩达解释了反向传播求导时,下面三个式子的来源,但我觉的不直观
首先说一下这个,根据链式法则,下图中,对a求导,然后用da来表示求导的结果, 用
代表
对
的求导结果,那么
对
的求导就是da乘以
然后
而为什么要有转置
,我的理解是
,我们先略去y,然后
可以看到和
都是n行m列的矩阵,肯定不能相乘的,只能把
转置才能和
相乘 。
在课程中吴恩达解释了反向传播求导时,下面三个式子的来源,但我觉的不直观
首先说一下这个,根据链式法则,下图中,对a求导,然后用da来表示求导的结果, 用
代表
对
的求导结果,那么
对
的求导就是da乘以
然后
而为什么要有转置
,我的理解是
,我们先略去y,然后
可以看到和
都是n行m列的矩阵,肯定不能相乘的,只能把
转置才能和
相乘 。