机器学习神经网络 BP 向后传播算法

库奇la啦

已于 2023-05-09 22:00:10 修改

阅读量148

点赞数

文章标签：机器学习算法神经网络

于 2023-05-09 21:49:20 首次发布

本文链接：https://blog.csdn.net/m0_70322975/article/details/130589593

版权

神经网络

BP 向后传播算法概念

像这种网络叫做全连接网络，也叫做前向传播网络

w 叫做每一次传播的权重 b则是偏置

假设由一组训练集 $(\overrightarrow{x_1},\overrightarrow{y_1})\quad(\overrightarrow{x_2},\overrightarrow{y_2})\cdots(\overrightarrow{x_n},\overrightarrow{y_n})$ x为特征属性 y为标签
假如将训练集中拿一个作为输入进入神经网络，若输出 $Y_i=y_i$ 说明这个神经网络不错

$E=\frac{1}{2}\sum\limits_{i=1}^n(y_i-Y_i)^2$ 为神经网络的损失函数，评判模型的好坏

怎样去更新权重w和偏置b呢？则是利用梯度下降算法

取样本值 $(\overrightarrow{x_1},\overrightarrow{y_1})\quad(\overrightarrow{x_2},\overrightarrow{y_2})\cdots(\overrightarrow{x_n},\overrightarrow{y_n})$ 作为神经网络的输入
$w_i b_i对E求偏导为\dfrac{\partial E}{\partial w} \dfrac{\partial E}{\partial b}$
迭代更新w b

$w_新 = w_旧 - \alpha\dfrac{\partial E}{\partial w_旧}$

$b_新 = b_旧 - \alpha\dfrac{\partial E}{\partial b_旧}$
$当所有\dfrac{\partial E}{\partial w} \dfrac{\partial E}{\partial b} 都为0，更新完毕$

BP 向后传播算法推导

由图可知
$z_1 = w_1x_1 + b_1$ $n_1 = f(z_1)$
$z_2 = w_2 n_1+ b_2$ $n_2 = f(z_2)$
$Y = n_2 = f_2(z_2) = f_2(w_2n_1 + b_2) = f_2(w_2f_1(z_1) + b_2) = f_2(w_2f_1(w_1x_1 + b_1) + b_2)$

$w_1对E求偏导$
$\dfrac{\partial E}{\partial w_1} = \dfrac{\frac{1}{2}(Y - y)^2}{\partial w_1} = (Y - y)\dfrac{\partial Y}{\partial w_1} = (Y - y)f^`_2(z_2)w_2f^`_1(z_1)x_1$
假设有m层每一层用l表示
则有 $z_l = w_in_{l-1} + b_l$
$w_l对E求偏导，如下$
$\dfrac{\partial E}{\partial w_l} = \dfrac{\partial E}{\partial z_l}\dfrac{\partial z_l}{\partial w_l}$ 容易知道 $\dfrac{\partial z_l}{\partial w_l}=n_{l-1}$
$那\dfrac{\partial E}{\partial z_l}该怎么求呢？$

可以知道
$z_{l+1} = w_{l+1}n_l + b_{l+1} = w_{l+1}f_l(z_l) + b_{l+1}$
因为 $n_l = f_l(z_l)$ ,才有上面的结果

$\dfrac{\partial E}{\partial z_l}求解过程如下$
$\dfrac{\partial E}{\partial z_l} = \dfrac{\partial E}{\partial z_{l+1}}\dfrac{\partial z_{l+1}}{\partial z_l} = \dfrac{\partial E}{\partial z_{l+1}}\dfrac{\partial z_{l+1}}{\partial n_l}\dfrac{\partial n_l}{\partial z_l} = \dfrac{\partial E}{\partial z_{l+1}}(w_{l+1})^Tf^`_l(z_l)$
令 $\dfrac{\partial E}{\partial z_l} = \delta_l$ 则 $\delta_l = \delta_{l+1}(w_{l+1})^Tf^`_l(z_l)$ 依次向后推，即可求出 $\dfrac{\partial E}{\partial z_l}$
推到最后一层 $\dfrac{\partial E}{\partial z_m} = \dfrac{\partial E}{\partial y}$
$\delta叫做误差项，或者叫做灵敏度$

BP 向后传播算法推导到此也就可以推导出来了👍

库奇la啦

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
机器学习神经网络 BP 向后传播算法

怎样去更新权重w和偏置b呢？则是利用梯度下降算法。假如将训练集中拿一个作为输入进入神经网络，若输出。BP 向后传播算法推导到此也就可以推导出来了👍。像这种网络叫做全连接网络，也叫做前向传播网络。为神经网络的损失函数，评判模型的好坏。w 叫做每一次传播的权重 b则是偏置。假设有m层每一层用l表示。叫做误差项，或者叫做灵敏度。x为特征属性 y为标签。说明这个神经网络不错。依次向后推，即可求出。
复制链接

扫一扫