深度学习与PyTorch笔记15

最新推荐文章于 2024-07-12 16:16:27 发布

niuniu990

最新推荐文章于 2024-07-12 16:16:27 发布

阅读量133

点赞数

文章标签： python pytorch

本文链接：https://blog.csdn.net/niuniu990/article/details/88320492

版权

MLP反向传播

在这里插入图片描述
最终的loss对倒数第二层的 $W_{ij}$ 求导的过程：
对 $W_{jk}$
$\frac{\partial E}{\partial W_{jk}}=(O_{k}-t_{k})O_{k}(1-O_{k})O^{J}_{j}$
令 $\delta^{K}_{k}=(O_{k}-t_{k})O_{k}(1-O_{k})$ ， $\delta^{K}_{k}$ 有k个值。
则 $\frac{\partial E}{\partial W_{jk}}=\delta^{K}_{k}O^{J}_{j}$
对 $w_{ij}$ ，将 $E$ 展开，
$\frac{\partial E}{\partial W_{ij}}=\frac{\partial }{\partial W_{ij}}\frac{1}{2}\sum_{k\in K}(O_{k}-t_{k})^{2}$
$\frac{\partial E}{\partial W_{ij}}=\sum_{k\in K}(O_{k}-t_{k})\frac{\partial }{\partial W_{ij}}O_{k}$
$\frac{\partial E}{\partial W_{ij}}=\sum_{k\in K}(O_{k}-t_{k})\frac{\partial }{\partial W_{ij}}\sigma(x_{k})$
$\frac{\partial E}{\partial W_{ij}}=\sum_{k\in K}(O_{k}-t_{k})\sigma(x_{k})(1-\sigma(x_{k}))\frac{\partial x_{k}}{\partial W_{ij}}$
$\frac{\partial E}{\partial W_{ij}}=\sum_{k\in K}(O_{k}-t_{k})O_{k}(1-O_{k})\frac{\partial x_{k}}{\partial O_{j}}\cdot\frac{\partial O_{j}}{\partial W_{ij}}$
$\frac{\partial E}{\partial W_{ij}}=\sum_{k\in K}(O_{k}-t_{k})O_{k}(1-O_{k})W_{jk}\frac{\partial O_{j}}{\partial W_{ij}}$
$\frac{\partial E}{\partial W_{ij}}=\frac{\partial O_{j}}{\partial W_{ij}}\sum_{k\in K}(O_{k}-t_{k})O_{k}(1-O_{k})W_{jk}$
$\frac{\partial E}{\partial W_{ij}}=O_{j}(1-O_{j})\frac{\partial x_{j}}{\partial W_{ij}}\sum_{k\in K}(O_{k}-t_{k})O_{k}(1-O_{k})W_{jk}$
$\frac{\partial E}{\partial W_{ij}}=O_{j}(1-O_{j})O_{i}\sum_{k\in K}(O_{k}-t_{k})O_{k}(1-O_{k})W_{jk}$
$\frac{\partial E}{\partial W_{ij}}=O_{i}O_{j}(1-O_{j})\sum_{k\in K}\sigma_{k}W_{jk}$
总结：
For an output layer node $k\in K$
$\frac{\partial E}{\partial W_{jk}}=O_{j}\delta_{k}$
Where $\delta_{k}=(O_{k}-t_{k})O_{k}(1-O_{k})$
For a hidden layer node $j\in J$
$\frac{\partial E}{\partial W_{jk}}=O_{i}\delta_{j}$
Where $\delta_{j}=O_{j}(1-O_{j})\sum_{k\in K}\sigma_{k}W_{jk}$