反向传播更新梯度的作用：

家北

于 2024-03-26 18:45:57 发布

阅读量324

点赞数 4

文章标签：人工智能机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq973768874/article/details/137054283

版权

一般的机器学习中，目的都是为了训练得出目标损失函数的最小值，而对直接求出最佳的损失函数的值是很困难的，而采用反向传播更新梯度的作用就是为了更新各个参数，从而得到最佳的损失函数的值。

而他的作用机理是什么呢，就是链式法则不断的求偏导数，例如：

而通过反向传播求出梯度之后，便能更新权值，例如SGD:

其中η是学习率（lr），更新后的权重重新计算，得到损失函数的值。

反向传播求梯度，就像我们站在山上的某个位置（想当于我们现在模型有的具体参数信息），想要以最佳的路线去到山下（取到最好的参数数据，使得损失值是最小）。首先，直观的方法就是环顾四周，向下山最快的方向走一步（数据里面体现为反向梯度走一个学习率），然后再次重复（环顾四周，找到最快的方向，再走一步），直到下山——这样的方法便是朴素的梯度下降——当前的海拔是我们的目标函数值，而我们在每一步找到的方向便是函数梯度的反方向（梯度是函数上升最快的方向，所以梯度的反方向就是函数下降最快的方向）。

疑惑一：得到梯度有什么用？

通过梯度和学习率的共同作用才能更新出不同的权重值，从而使得模型的训练提取到重要特征，使模型达到最好的效果。

关注

4
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
反向传播更新梯度的作用：

反向传播求梯度，就像我们站在山上的某个位置（想当于我们现在模型有的具体参数信息），想要以最佳的路线去到山下（取到最好的参数数据，使得损失值是最小）。首先，直观的方法就是环顾四周，向下山最快的方向走一步（数据里面体现为反向梯度走一个学习率），然后再次重复（环顾四周，找到最快的方向，再走一步），直到下山——这样的方法便是朴素的梯度下降——当前的海拔是我们的目标函数值，而我们在每一步找到的方向便是函数梯度的反方向（梯度是函数上升最快的方向，所以梯度的反方向就是函数下降最快的方向）。疑惑一：得到梯度有什么用？
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。