反向传播算法误差迭代的理解
参考自反向误差传播迭代公式
J 指是代价函数,a是该节点的总输出,z是该节点的总误差
误差传播的关键在于理解
δ(l)= ∂ J ∂ z \frac{∂J}{∂z } ∂z∂J= ∂ J ∂ a \frac{∂J}{∂a } ∂a∂J ∂ a ∂ z \frac{∂a}{∂z } ∂z∂a=(θ(l))Tδ(l+1) .* g’(z(l))
其中a = g(z) =
1
(
1
−
e
−
z
)
\frac{1}{(1-e^-z^) }
(1−e−z)1
即g’(z(l)) = a(l)*(1-a(l))
最后利用∂J/∂θij(l) = aj(l)*θi(l+1)代替导数
详细见
https://www.bilibili.com/video/BV164411b7dx?p=52
看了一个多小时结合查资料才get到这个点