（一）梯度下降算法

最新推荐文章于 2024-07-21 13:38:21 发布

爱编程的机器猫

最新推荐文章于 2024-07-21 13:38:21 发布

阅读量1.6k

点赞数

分类专栏：深度学习（PyTorch）文章标签：算法深度学习

本文链接：https://blog.csdn.net/qq_45849192/article/details/122728631

版权

深度学习（PyTorch）专栏收录该内容

10 篇文章 2 订阅

订阅专栏

（一）梯度下降算法

深度学习的核心精髓就是梯度下降算法。在某些方面深度学习表现出来的结果可以接近人的智力，就是因为它可以求解出一个巨大的函数，而这个函数的用来求解的方法就是梯度下降算法。

下面我们来看一个函数：
$loss = x^2 * sin(x)$
令
$f(x) = x^2 * sin(x)$
所以
$f'(x) = 2xsin(x) + x^2cos(x)$
这样我们就能计算在当前位置 $x$ 的导数值。通过高等数学的学习我们知道梯度是一个矢量，但是对于只有一个变量的情况，导数值等于梯度的模，所以此时的梯度值等于导数值。我们令 $\Delta x$ 为 $x$ 的梯度所以我们可以通过公式
$lr\Delta x$
对 $x$ 迭代更新去让 $x$ 不断地逼近极小值（注意这里是极小值不是最小值），具体如下图：

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-f3PJQS0l-1643339749249)(C:\Users\ying\AppData\Roaming\Typora\typora-user-images\image-20220128110603437.png)]$

从图中可见 $x$ 会不断向右增大到极小值点后停止。这里的 $l r$ 是学习速率（learning rate），我们可以通过调节学习速率改变 $x$ 的变化速率。假如 $l r$ 过大那么就会出现下图的情况：

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-bSjEpIjV-1643339749251)(C:\Users\ying\AppData\Roaming\Typora\typora-user-images\image-20220128111206897.png)]$

由于 $x$ 每一步移动过大，这时它会在极小值点周围发生比较大的左右抖动，而无法逼近极小值。

总的来说，梯度下降算法就是通过利用当前位置的梯度信息去不断比较我们所想要得到的那个最优解。
利用当前位置的梯度信息去不断比较我们所想要得到的那个最优解。

爱编程的机器猫

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
（一）梯度下降算法

（一）梯度下降算法深度学习的核心精髓就是梯度下降算法。在某些方面深度学习表现出来的结果可以接近人的智力，就是因为它可以求解出一个巨大的函数，而这个函数的用来求解的方法就是梯度下降算法。下面我们来看一个函数：loss=x2∗sin(x)loss = x^2 * sin(x)loss=x2∗sin(x)令f(x)=x2∗sin(x)f(x) = x^2 * sin(x)f(x)=x2∗sin(x)所以f′(x)=2xsin(x)+x2cos(x)f'(x) = 2xsin(x) + x^
复制链接

扫一扫