BP反向算法推导

最新推荐文章于 2022-03-07 10:30:33 发布

daihp1022

最新推荐文章于 2022-03-07 10:30:33 发布

阅读量145

点赞数 1

分类专栏：机器学习文章标签：机器学习深度学习反向传播

本文链接：https://blog.csdn.net/qq_34135624/article/details/103335879

版权

机器学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

1、符号设定

$a_{i-1}$ 为第 $i$ 层输入向量
$x_{i}$ 为第 $i$ 层输出向量
$W_{i}$ 为第 $i$ 层到下一层的权重矩阵
$\sigma$ 为每一层的sigmod激活函数
$o$ 为最后一层的下标， $y$ 为最后一层的真实值， $h$ 为预测值
$L$ 为一个样本的损失函数，其中 $L=\frac{1}{2}(y-h)^2$
根据设定，我们有以下等式
$x_{i}=\sigma(a_{i-1})$ $a_{i}=W_{i}x_{i}$ $h=\sigma(a_{o})=\sigma(W_{o}x_{o})$

2、对于输出层

$\frac{\partial L}{\partial W_o}=\frac{\partial L}{\partial h}\frac{\partial h}{\partial a_o}\frac{\partial a_o}{\partial W_o}=(h-y)h(1-h)x_o$
令误差 $\delta_o=\frac{\partial L}{\partial a_o}=(h-y)h(1-h)$ ,则 $\frac{\partial L}{\partial W_o}=\delta_ox_o$
对于 $W_o$ 梯度更新公式为： $W_o=W_o-\eta\delta_ox_o$

3、对于上一个隐藏层 $k$

由于 $a_o=W_ox_o=W_o\sigma(a_k)$ ， $a_k=W_kx_k$ ，则有
$\frac{\partial L}{\partial W_k}=\frac{\partial L}{\partial h}\frac{\partial h}{\partial a_o}\frac{\partial a_o}{\partial a_k}\frac{\partial a_k}{\partial W_k}=(h-y)h(1-h)W_oa_o(1-a_o)x_k$
令隐藏层 $k$ 的误差
$\delta_k=\frac{\partial L}{\partial a_k}=\delta_oW_oa_o(1-a_o)$ 则有 $\frac{\partial L}{\partial W_k}=\delta_kx_k$
对于 $W_k$ 梯度更新公式为: $W_k=W_k-\eta\delta_kx_k$

若存在隐藏层 $k - 1$ ，同理可得隐藏层 $k - 1$ 的误差 $\delta_{k-1}=\frac{\partial L}{\partial a_{k-1}}=\delta_kW_ka_k(1-a_k)$ 则有 $\frac{\partial L}{\partial W_{k-1}}=\delta_{k-1}x_{k-1}$ 对于 $W_{k-1}$ 梯度更新公式为: $W_{k-1}=W_{k-1}-\eta\delta_{k-1}x_{k-1}$

4、计算顺序

根据2、3可知，当要更新网络中神经元的所有权重时，需从输出层开始并逐步后向计算各隐藏层的输入值和输出值和误差项

daihp1022

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
BP反向算法推导

1、符号设定ai−1a_{i-1}ai−1为第iii层输入向量xix_{i}xi为第iii层输出向量WiW_{i}Wi为第iii层到下一层的权重矩阵σ\sigmaσ 为每一层的sigmod激活函数ooo为最后一层的下标，yyy为最后一层的真实值，hhh为预测值LLL 为一个样本的损失函数，其中L=12(y−h)2L=\frac{1}{2}(y-h)^2L=21(y−h)2根...
复制链接

扫一扫