Backpropagation

最新推荐文章于 2024-08-26 07:21:08 发布

never or now7

最新推荐文章于 2024-08-26 07:21:08 发布

阅读量91

点赞数

本文链接：https://blog.csdn.net/m0_49483791/article/details/124697977

版权

深度学习机器学习逻辑回归

Backpropagation简称BP，翻译为反向传播，是一种与最优化方法（如梯度下降法）结合使用的训练人工神经网络的方法。该方法会对网络中所有weights计算loss function的梯度，用来更新这些weights以minimize loss function。
在这里插入图片描述

$h_1=i_1w_1+i_2w_2+b_1\\ h_2=i_1w_3+i_2w_4+b_1\\ o_1=h_1w_5+h_2w_6+b_2\\ o_2=h_1w_7+h_2w_8+b_2\\$
每个神经元后用激活函数sigmoid函数激活，图中未表示出。上述就是前向传播的过程，第一次使用的参数为random initialzation得到，后续计算第一次输出与实际值的总误差L（这里使用均方误差作为损失函数）。
$L=LossFunction=\sum_{i=1}^2\frac{1}{2}(target_{o_1}-o_1)^2\\ L=\frac{1}{2}(target_{o_1}-o_1)^2+\frac{1}{2}(target_{o_2}-o_2)^2$
计算出总误差后，我们需要得知每个weight对误差的影响，并对weight进行修正。
$\frac{\partial L}{\partial w_1}=\frac{\partial h_1}{\partial w_1}\frac{\partial o_1}{\partial h_1}\frac{\partial L}{\partial o_1}+\frac{\partial h_1}{\partial w_1}\frac{\partial o_2}{\partial h_1}\frac{\partial L}{\partial o_2}\\ \frac{\partial L}{\partial w_2}=\frac{\partial h_1}{\partial w_2}\frac{\partial o_1}{\partial h_1}\frac{\partial L}{\partial o_1}+\frac{\partial h_1}{\partial w_2}\frac{\partial o_2}{\partial h_1}\frac{\partial L}{\partial o_2}\\ \frac{\partial L}{\partial w_3}=\frac{\partial h_2}{\partial w_3}\frac{\partial o_1}{\partial h_2}\frac{\partial L}{\partial o_1}+\frac{\partial h_2}{\partial w_3}\frac{\partial o_2}{\partial h_2}\frac{\partial L}{\partial o_2}\\ \frac{\partial L}{\partial w_4}=\frac{\partial h_2}{\partial w_4}\frac{\partial o_1}{\partial h_2}\frac{\partial L}{\partial o_1}+\frac{\partial h_2}{\partial w_4}\frac{\partial o_2}{\partial h_2}\frac{\partial L}{\partial o_2}\\ \frac{\partial L}{\partial w_5}=\frac{\partial o_1}{\partial w_5}\frac{\partial L}{\partial o_1}\\ \frac{\partial L}{\partial w_6}=\frac{\partial o_1}{\partial w_6}\frac{\partial L}{\partial o_1}\\ \frac{\partial L}{\partial w_7}=\frac{\partial o_2}{\partial w_7}\frac{\partial L}{\partial o_2}\\ \frac{\partial L}{\partial w_8}=\frac{\partial o_2}{\partial w_8}\frac{\partial L}{\partial o_2}\\$
若每次都通过前向传播计算weight对loss function的影响，则计算复杂度过高，所以采取从后往前计算的反向传播方法。
$\frac{\partial L}{\partial o_1}\quad\frac{\partial L}{\partial o_2}\\\\ \frac{\partial o_1}{\partial h_1}\quad\frac{\partial o_1}{\partial h_2}\quad\frac{\partial o_2}{\partial h_1}\quad\frac{\partial o_2}{\partial h_2}\quad\frac{\partial o_1}{\partial w_5}\quad\frac{\partial o_1}{\partial w_6}\quad\frac{\partial o_2}{\partial w_7}\quad\frac{\partial o_2}{\partial w_8}\quad\\\\ \frac{\partial h_1}{\partial w_1}\quad\frac{\partial h_1}{\partial w_2}\quad\frac{\partial h_2}{\partial w_3}\quad\frac{\partial h_2}{\partial w_4}\quad$
使用反向传播，只需计算以上的梯度，相比于前向传播计算可以避免很多重复梯度计算，大大降低了计算复杂度。

never or now7

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Backpropagation

Backpropagation简称BP，翻译为反向传播，是一种与最优化方法（如梯度下降法）结合使用的训练人工神经网络的方法。该方法会对网络中所有weights计算loss function的梯度，用来更新这些weights以minimize loss function。h1=i1w1+i2w2+b1h2=i1w3+i2w4+b1o1=h1w5+h2w6+b2o2=h1w7+h2w8+b2h_1=i_1w_1+i_2w_2+b_1\\h_2=i_1w_3+i_2w_4+b_1\\o_1=h_1w_5
复制链接

扫一扫