机器学习反向传播梯度求导

最新推荐文章于 2023-02-06 15:42:03 发布

光明的心2

最新推荐文章于 2023-02-06 15:42:03 发布

阅读量482

点赞数

分类专栏：神经网络专栏

本文链接：https://blog.csdn.net/qq_43680142/article/details/105248097

版权

神经网络专栏专栏收录该内容

3 篇文章 0 订阅

订阅专栏

机器学习反向传播梯度推导

在我的前一篇文章中，已经推导出了单层感知机梯度的计算公式
多层感知机梯度推导
在这里插入图片描述
$\frac {\varphi_E} {\varphi_{W_{j_k}}} = (0_k - t_k)0_k(1 - 0_k) W_j^0$
1. 链式法则：
$\frac {\varphi f(x)} {\varphi g(x)} = \frac {\varphi f(x)} {\varphi h(x)} \frac {\varphi h(x)} {\varphi g(x)}$

$\frac {\varphi_E} {\varphi_{W_{j_k}^1}} = \frac {\varphi_E} {\varphi_{W_{j_k}^2}} \frac {\varphi_{W_{j_k}^2}} {\varphi_{W_{j_k}^1}}$

2. bpnn推导：
在这里插入图片描述
$\Sigma, \sigma为激活函数，同时O_j^J = \sigma(x_j^J)$

$所以：\frac {\varphi_E} {\varphi_{W_{j_k}^K}} = (O_k^K - t_k)O_k^K(1 - O_k^K) O_j^J$
$\frac {\varphi_E} {\varphi_{W_{j_k}^K}} = (O_k^K - t_k)\delta_k O_j^J$
$那么现在的关键就是求出\frac {\varphi_E} {\varphi_{W_{i_j}^J}}以及找出下一层\\权值梯度与上一层权值梯度的关系,依次迭代$
$\frac {\varphi_E} {\varphi_{W_{i_j}^J}} = \frac {\varphi{{\frac 1 2}\Sigma_{i=0}^m(O_k^K - t_k)^2}} {\varphi_{W_{i_j}^J}}$
$对 {W_{i_j}^J} 的导数有影响的只有O_k^K,所以：$
$\frac {\varphi_E} {\varphi_{W_{i_j}^J}} = \frac {\varphi{{\frac 1 2}(O_k^K - t_k)^2}} {\varphi_{W_{i_j}^J}}$
$\frac {\varphi_E} {\varphi_{W_{i_j}^J}} = (O_k^K - t_k){\frac {\varphi{O_k^K }} {\varphi_{W_{i_j}^J}}}$
$\frac {\varphi_E} {\varphi_{W_{i_j}^J}} = (O_k^K - t_k) \frac {\varphi{\sigma(x_k^K)}} {\varphi_{W_{i_j}^J}}$
$\frac {\varphi_E} {\varphi_{W_{i_j}^J}} = (O_k^K - t_k)O_k^K(1 - O_k^K) \frac {\varphi_{x_k^K}} {\varphi_{W_{i_j}^J}}$
$\frac {\varphi_E} {\varphi_{W_{i_j}^J}} = (O_k^K - t_k)O_k^K(1 - O_k^K) \frac {\varphi_{x_k^K}} {\varphi_{O_j^J}} \frac {\varphi_{O_j^J}} {\varphi_{W_{i_j}^J}}$
$\frac {\varphi_E} {\varphi_{W_{i_j}^J}} = (O_k^K - t_k)\delta_k^K W_{j_k}\frac {\varphi_{O_j^J}} {\varphi_{W_{i_j}^J}}$
$\frac {\varphi_E} {\varphi_{W_{i_j}^J}} = (O_k^K - t_k) \delta_k^K W_{j_k} \frac {\varphi_{\sigma(x_j^J)}} {\varphi_{W_{i_j}^J}}$
$类似于上一层推导：\\ \frac {\varphi_E} {\varphi_{W_{i_j}^J}} =(O_k^K - t_k) \delta_k^K W_{j_k} \delta_j^J x_j^0$
神经网络计算过程：