机器学习基础篇-NN反向传播

最新推荐文章于 2023-04-07 19:53:44 发布

Mr.Wiggles

最新推荐文章于 2023-04-07 19:53:44 发布

阅读量336

点赞数

分类专栏：机器学习基础文章标签：神经网络深度学习机器学习人工智能

本文链接：https://blog.csdn.net/Vihagle/article/details/118219874

版权

机器学习基础专栏收录该内容

31 篇文章 4 订阅

订阅专栏

在深度学习的神经网络中，可以通过Computation Graph建立每层函数之间的关系。下面开始举例。

前向传播
首先我们有三个参数a,b,c，其损失函数为J(w) = 3(a+b*c)，然后计算每个参数的梯度：
$\frac{dJ}{da};\frac{dJ}{db};\frac{dJ}{dc}$
然后我们可以通过拆解损失函数，并通过中间参数进行传递：
$bc\\v = a + u\\J = 3v$
由上，可以建立一个计算图：
在这里插入图片描述
反向传播
在计算图的基础上，可以清楚的得到每个参数的梯度求导公式：
$\frac{dJ}{da} = \frac{dJ}{dv}\frac{dv}{da}\\ \frac{dJ}{db} = \frac{dJ}{dv}\frac{dv}{du}\frac{du}{db}\\ \frac{dJ}{db} = \frac{dJ}{dv}\frac{dv}{du}\frac{du}{dc}$
为了让求解过程更清晰地表达，我们将公式带入到计算图中
在这里插入图片描述
现在开始反向传播，通过简单地组合节点梯度来计算每个参数的梯度：

所以有
$\frac{dJ}{da} = \frac{dJ}{dv}\frac{dv}{da} = 3*1=3\\ \frac{dJ}{db} = \frac{dJ}{dv}\frac{dv}{du}\frac{du}{db}=3*1*2=6\\ \frac{dJ}{db} = \frac{dJ}{dv}\frac{dv}{du}\frac{du}{dc}=3*1*3=9$

在NN神经网络中，通过线性函数和非线性函数的组合构成一个网络去解决问题，并通过反向传播更新线性函数的超参数的权重来拟合数据，其中非线性函数sigmoid是激活函数，其作用是当只有线性函数组合时，整个函数还是线性函数，只有组合了sigmoid，才能是非线性函数，用来拟合非线性关系（生活中大多数问题都是非线性问题）。

Mr.Wiggles

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
机器学习基础篇-NN反向传播

在深度学习的神经网络中，可以通过Computation Graph建立每层函数之间的关系。下面开始举例。前向传播首先我们有三个参数a,b,c，其损失函数为J(w) = 3(a+b*c)，然后计算每个参数的梯度：dJda;dJdb;dJdc\frac{dJ}{da};\frac{dJ}{db};\frac{dJ}{dc}dadJ;dbdJ;dcdJ然后我们可以通过拆解损失函数，并通过中间参数进行传递：u=bcv=a+uJ=3vu = bc\\v = a + u\\J = 3vu=bcv
复制链接

扫一扫