梯度下降法

最新推荐文章于 2024-09-11 16:51:25 发布

Phoenix_tgd

最新推荐文章于 2024-09-11 16:51:25 发布

阅读量353

点赞数

分类专栏：数学知识文章标签：梯度下降法

数学知识专栏收录该内容

3 篇文章 0 订阅

订阅专栏

前些时间接触了机器学习，发现梯度下降法是机器学习里比较基础又比较重要的一个求最小值的算法。梯度下降算法过程如下：

1）随机初始值 $\alpha _0$ ；

2）迭代 $\alpha _(k+1)=\alpha _k+\alpha _kS^{k}$ ，直至收敛。 $S^{k}$ 表示在 $\alpha _k$ 处的负梯度方向， $\alpha _k$ 表示学习率。

在这里，简单谈一下自己对梯度下降法的理解。

首先，要明确梯度是一个向量，是一个n元函数f关于n个变量的偏导数，比如三元函数f的梯度为(fx,fy,fz)，二元函数f的梯度为(fx,fy），一元函数f的梯度为fx。然后要明白梯度的方向是函数f增长最快的方向，梯度的反方向是f降低最快的方向。

我们以一元函数为例，介绍一下梯度下降法。

设f(x) = (x-1)2+1/2，

上图给出了函数f的图像和初始值x0，我们希望求得函数f的最小值，因为沿负梯度方向移动一小步后，f值降低，故只需x0沿着负梯度方向移动一小步即可。

而f在点x0的导数大于0，从而f在点x0的梯度方向为正，即梯度方向为f’(x0)，故由梯度下降法可知，下一个迭代值 $x_1=x_0+\alpha _0(-f'(x_0))$ ，也就是说x0向左移动一小步到了x1，同理在x1点的导数同样大于零，下一次迭代x1向左移动一小步到达x2，一直进行下去，只要每次移动的步数不是很大，我们就可以得到收敛1的解x。

上述证实了我们对分析的验证。

同样，如果处置选在了最小值的左边，即如图所示：

由于f’(x0)<0，所以梯度方向为负，负梯度方向为正，故需将x0沿负梯度方向移动一小步，即向右移动一小步，这样使得f值更小一些。或用梯度下降法迭代公式 $x_(k+1)=x_k+\alpha _k(-f'(x_k))$ ，依次我们可以得到如图所示的x1,x2,...,xk,...，直到收敛至最小值。