BP神经网络误差反向传播公式

最新推荐文章于 2024-08-07 21:45:43 发布

芝诺兔子

最新推荐文章于 2024-08-07 21:45:43 发布

阅读量207

点赞数

文章标签：神经网络人工智能

本文链接：https://blog.csdn.net/qq_17785775/article/details/128862024

版权

1. $\frac{\partial e}{\partial W^{l}}$ 与 $\frac{\partial e}{\partial B^{l}}$

$损失函数 :$ $e=g\left(net^{l}\right)$ $第 l 层净输入 :$ $net^{l}=W^{l}\cdot O^{l-1}+B^{l}$ $损失函数的微分 :$ $de=tr\left(\frac{\partial e}{\partial net^{l}}^{T}\cdot dnet^{l}\right)$ $净输入的微分 :$ $dnet^{l} =dW^{l}\cdot O^{l-1}+dB^{l}$

$de=tr\left(\frac{\partial e}{\partial net^{l}}^{T}\cdot \left(dW^{l}\cdot O^{l-1}+dB^{l}\right)\right)$ $=tr\left(\frac{\partial e}{\partial net^{l}}^{T}\cdot dW^{l}\cdot O^{l-1}+\frac{\partial e}{\partial net^{l}}^{T}\cdot dB^{l}\right)$ $=tr\left(O^{l-1}\cdot \frac{\partial e}{\partial net^{l}}^{T}\cdot dW^{l}+\frac{\partial e}{\partial net^{l}}^{T}\cdot dB^{l}\right)$

$损失函数对l层权值W^{l}的偏导:$ $\frac{\partial e}{\partial W^{l}}=\left(O^{l-1}\cdot \frac{\partial e}{\partial net^{l}}^{T}\right)^{T}$ $=\frac{\partial e}{\partial net^{l}}\cdot \left(O^{l-1}\right)^{T}$ $损失函数对l层偏移B^{l}的偏导:$ $\frac{\partial e}{\partial B^{l}}=\frac{\partial e}{\partial net^{l}}$

2. $\frac{\partial e}{\partial net^{l}}$ 递推公式

$损失函数 :$ $e=g\left(net^{l+1}\right)$ $第 l + 1 层的净输入 :$ $net^{l+1}=W^{l+1}\cdot O^l+B^{l+1}$ $第 l 层净输出 :$ $O^l=f\left(net^l\right)$ $损失函数的微分 :$ $de=tr\left(\frac{\partial e}{\partial net^{l+1}}^T\cdot dnet^{l+1}\right)$ $净输入的微分 :$ $dnet^{l+1}=W^{l+1} \cdot dO^l$ $净输出的微分 :$ $dO^l=f^{'}\left(net^{l}\right)\odot dnet^{l}$

$de=tr\left(\frac{\partial e}{\partial net^{l+1}}^T\cdot W^{l+1}\cdot \left(f^{'}\left(net^{l}\right) \odot dnet^{l}\right)\right)$ $=tr\left (\left(\left(\frac{\partial e}{\partial net^{l+1}}^T\cdot W^{l+1}\right)\odot \left(f^{'}\left(net^{l}\right)\right)^{T}\right)\cdot dnet^{l}\right)$

$损失函数对第 l 层净输入与第 l + 1 层净输入偏导的递归式 :$ $\frac{\partial e}{\partial net^{l}}=\left(\left(\frac{\partial e}{\partial net^{l+1}}^T\cdot W^{l+1}\right)\odot \left(f^{'}\left(net^{l}\right)\right)^{T}\right)^{T}$ $=\left(\frac{\partial e}{\partial net^{l+1}}^T\cdot W^{l+1}\right)^{T}\odot f^{'}\left(net^{l}\right)$ $=\left(\left(W^{l+1}\right)^{T}\cdot \frac{\partial e}{\partial net^{l+1}}\right)\odot f^{'}\left(net^{l}\right)$