梯度下降法的简单理解

最新推荐文章于 2024-08-17 23:32:55 发布

wgdzz

最新推荐文章于 2024-08-17 23:32:55 发布

阅读量3.6k

点赞数

分类专栏：机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wgdzz/article/details/48804599

版权

机器学习专栏收录该内容

6 篇文章 0 订阅

订阅专栏

梯度下降法

　　梯度下降法（gradient descent）或最速下降法（steepest descent）是求解无约束最优化问题的一种最常用的方法。
负梯度方向是使函数值下降最快的方向，在迭代的每一步，以负梯度方向更新x的值，从而达到减少函数值的目的。
假设 $f(x)$ 在 $R_n$ 上具有一阶连续偏导数，要求解的无约束最优化问题是：

min x \in R n f (x)

$\min\limits_{x \in R_n} f(x)$
由于

f(x) $f(x)$ 具有一阶连续偏导数，若第

k $k$ 次迭代值为

x(k) $x^{(k)}$ ，则可将

f(x) $f(x)$ 在

x(k) $x^{(k)}$ 附近进行泰勒展开：

f (x) = f (x (k)) + g T k (x - x (k))

$f(x) = f(x^{(k)}) + g_k^T(x-x^{(k)})$
这里，

gk=g(x(k))=∇f(x(k)) $g_k = g(x^{(k)}) = \nabla f(x^{(k)})$ 为

f(x) $f(x)$ 在

x(k) $x^{(k)}$ 的梯度。
求出第

k+1 $k+1$ 次迭代值

x(k+1) $x^{(k+1)}$ ：

x(k+1)←x(k)+λkpk $x^{(k+1)} \leftarrow x^{(k)} + \lambda_k p_k$
其中，

pk $p_k$ 是搜索方向，取负梯度方向

pk=−∇f(x(k)) $p_k = -\nabla f(x^{(k)})$ ，

λk $\lambda_k$ 是步长，由一维搜索确定，即

λk $\lambda_k$ 使得

f(x(k)+λkpk)=minλ≥0f(x(k)+λpk) $f(x^{(k)} + \lambda_k p_k) = \min\limits_{\lambda \geq 0} f(x^{(k)} + \lambda p_k)$

简单推导：

f (x (k + 1)) = f (x (k)) + \nabla f (x (k)) * (x (k + 1) - x (k))

$\begin{equation} f(x^{(k+1)}) = f(x^{(k)}) + \nabla f(x^{(k)})*(x^{(k+1)}-x^{(k)}) \end{equation}$

取 $x^{(k+1)} = x^{(k)} + \lambda p_k = x^{(k)} + \lambda * (-\nabla f(x^{(k)}))$ ，带入上式有：

f (x (k + 1)) = f (x (k)) - λ * (\nabla f (x (k))) 2

$f(x^{(k+1)}) = f(x^{(k)}) - \lambda*(\nabla f(x^{(k)}))^2$ ，所以

f(x(k+1))≤f(x(k)) $f(x^{(k+1)}) \leq f(x^{(k)})$ ，且如果

f(x) $f(x)$ 存在最小值，因此多次迭代下，可以收敛。
这里写图片描述

这里写图片描述

这里写图片描述

　　牛顿法和拟牛顿法也是求解无约束最优化问题常用的方法，有收敛速度快的优点。牛顿法是迭代算法，每一步需要求解目标函数的海赛矩阵的逆矩阵，计算比较复杂。拟牛顿法通过正定矩阵近似海赛矩阵的逆矩阵或海赛矩阵，简化了这一计算过程。
以下三种方法都是拟牛顿法：
DFP（Davidon-Fletcher-Powell）算法
BFGS（Broyden-Fletcher-Goldfarb-Shanno）算法
L-BFGS算法

参考资料：
1. 《统计学习方法》李航
2. [泰勒公式]　https://ss2.baidu.com/6ONYsjip0QIZ8tyhnq/it/u=2362434890,1610636723&fm=58

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。