【优化算法】——梯度下降算法（通俗易懂，快速入门）

AI_dataloads

已于 2023-09-11 19:09:28 修改

阅读量2.1k

点赞数 8

文章标签：算法

于 2023-09-10 21:56:04 首次发布

本文链接：https://blog.csdn.net/AI_dataloads/article/details/132794595

版权

概述：

梯度下降算法（Gradient-descent）是一种优化算法，常用于机器学习和深度学习中。虽然听起来有点难，但实际上，它是一种寻找函数最低点的简单而有效的方法。本文将以通俗易懂的方式介绍梯度下降算法的原理和推导过程，着重介绍数学中的梯度下降算法，想要了解机器学习中的梯度下降算法可以参考：逻辑回归中的梯度下降。

梯度下降的例子：

寻找最低点。假设你在一个山坡上，想要找到离你最近的山谷。你站在当前位置，希望每次朝最陡峭的方向走一小步，直到到达山谷底部。这就是梯度下降的直观概念。沿着梯度的反方向走直到到达山谷底部。

算法：

朝最陡峭的方向前进在数学中，我们用函数的梯度来表示山坡的陡峭程度。梯度下降算法的核心思想是沿着梯度的反方向走一小步。为什么是梯度的反方向呢？因为梯度指向函数增长最快的方向，我们要找的是函数的最低点，所以要往相反的方向移动。

推导过程:

我们通过一个简单的二次函数来进行推导。假设我们有一个目标函数f(x)，我们所处的初始点为x0。我们需要找到这个函数的局部最小值(可能是全局最小值）。那么梯度下降算法的更新规则可以这样定义：

$x_{new}=x_{old}-\alpha*\bigtriangledown f(x_{old})$

其中α 是学习率，决定了我们沿着梯度方向迈出的步长；∇f(x) 是函数 f(x) 在点 x 的梯度。我们首先选择一个初始值x0，并计算函数在该点的梯度∇f(x0)。然后，我们将当前位置更新为：
x1 = x0 - $\alpha$ * ∇f(x0)

..........

$x_{n}$ = $x_{n-1}$ - $\alpha$ * ∇f( $x_{n-1}$ )

通过重复这个过程，我们不断更新x的值，直到达到满足我们需求的精度或固定的迭代次数。下图就是函数f(x)=2x^2+2x+1的梯度下降找到局部最小值的过程：

这里我们再以以函数f（x，y）=x^2/5 +y^2/3为例，红点即为所在点通过梯度下降的迭代过程（从上往下）：

陷阱和技巧:

利用梯度下降算法也需要注意一些点。首先，选择合适的学习率很重要。如果学习率过大，可能会导致错过最低点；如果学习率过小，收敛速度会很慢。其次，算法可能会陷入局部最低点，而不是全局最低点。为了解决这个问题，可以尝试多次运行算法，使用不同的初始值。此外，在机器学习中还有一些改进的算法，如随机梯度下降、批量梯度下降、随机批量梯度下降、动量梯度下降等（详细可以参考：逻辑回归中的梯度下降），可以提高效率和性能。

结论：

梯度下降算法是一种简单而有效的优化算法，用于寻找函数的最低点。通过计算函数的梯度，并沿着梯度的反方向进行步进，我们可以逐步接近最低点。尽管存在一些陷阱和技巧，但掌握梯度下降算法可以帮助我们理解和解决各种优化问题。希望通过本篇，可以让你对梯度下降算法有了更清晰的理解

AI_dataloads

关注

8
点赞
踩
19

收藏

觉得还不错? 一键收藏
1
评论
【优化算法】——梯度下降算法（通俗易懂，快速入门）

梯度下降算法（Gradient-descent）是一种优化算法，常用于机器学习和深度学习中。虽然听起来有点难，但实际上，它是一种寻找函数最低点的简单而有效的方法。本文将以通俗易懂的方式介绍梯度下降算法的原理和推导过程，着重介绍数学中的梯度下降算法，想要了解机器学习中的梯度下降算法可以参考：。
复制链接

扫一扫