【数学】梯度下降，牛顿法与拟牛顿法

最新推荐文章于 2024-07-17 02:05:32 发布

哈乐笑

最新推荐文章于 2024-07-17 02:05:32 发布

阅读量2.7k

点赞数 3

分类专栏：数学文章标签：数学

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/haolexiao/article/details/60780350

版权

数学专栏收录该内容

7 篇文章 7 订阅

订阅专栏

这三个优化算法，实在是太过经典，以至于很多文章都在说这个算法。这里主要就写一写我自己的感悟吧。剩下的再集成一下别的感觉比较好的博客中的方法。

梯度下降

将 $f(x)$ 一阶泰勒展开：

f (x) = f (x 0) + (x - x 0) f' (x 0)

$f(x) = f(x_0)+(x-x_0)f'(x_0)$

f (x) = f (x 0) + Δ x f' (x 0)

$f(x) = f(x_0)+\Delta xf'(x_0)$
如果当前处于

x0 $x_0$ 节点，要使得前进同样的距离使得

f(x) $f(x)$ 变的最小，则

Δx=−δf′(x) $\Delta x = - \delta f'(x)$ 时

f (x) = f (x 0) - δ f' 2 (x 0)

$f(x) = f(x_0)-\delta f'^2(x_0)$
新的

f(x) $f(x)$ 能够取得下一步的最小值
这也是梯度下降算法为什么沿着梯度进行下降能够取得最小值的证明。
用梯度下降法，每次

xn=xn−1−δf′(x) $x_n = x_{n-1}- \delta f'(x)$
在多元函数中：

x n = x n - 1 - δ \nabla f (x)

$x_n = x_{n-1}- \delta \nabla f(x)$

牛顿法

将 $f(x)$ 二阶泰勒展开：

f (x) = f (x 0) + Δ x f' (x 0) + 1 2 Δ x 2 f'' (x 0)

$f(x) = f(x_0)+\Delta xf'(x_0)+\frac{1}{2}\Delta x^2f''(x_0)$
因为要使得

f(x) $f(x)$ 取得最小值，则

f′(x) $f'(x)$ 在最小值点必为0，将上式两边同时求导得到【其实直接对

f′(x) $f'(x)$ 进行一阶泰勒展开也可以】

f' (x) = f' (x 0) + Δ x f'' (x 0)

$f'(x) = f'(x_0)+\Delta xf''(x_0)$
取

f′(x)=0 $f'(x) = 0$ 得到

f' (x 0) + Δ x f'' (x 0) = 0

$f'(x_0)+\Delta xf''(x_0) = 0$

Δ x = - f ' ( x 0 ) f '' ( x 0 )

$\Delta x = -\frac{f'(x_0)}{f''(x_0)}$

所以用牛顿法，每次取得 $x_n = x_{n-1} -\frac{f'(x_0)}{f''(x_0)}$
在多元函数中

x n = x n - 1 - (\nabla 2 f (x 0)) - 1 \nabla f (x 0)

$x_n = x_{n-1} -(\nabla ^2 f(x_0))^{-1}{\nabla f(x_0)}$
其中

∇2f(x0) $\nabla ^2 f(x_0)$ 就是

f(x0) $f(x_0)$ 的海森矩阵【二阶梯度矩阵】

其实，牛顿法在数值分析里面，是用来求解 $f(x) = 0$ 的解的问题的，相较于二分法求值的一阶收敛速度，牛顿法是一个二阶收敛速度。
用牛顿法求解 $f(x) = 0$ 的问题的时候，只用一阶导数就好
不过在最优化问题中，需要求解的是最值点，所以找的是其 $f'(x) = 0$ 的点，所以就用到了二阶导数。

拟牛顿法

拟牛顿法直接看下面参考文献吧
大体思路上来说用牛顿法需要计算Hessian矩阵的逆矩阵，运算复杂度太高（ $O(n^3)$ 级别的）。因此，很多牛顿算法的变形出现了，这类变形统称拟牛顿算法。
BFGS是用迭代法去近似计算海森矩阵。
而BFGS需要额外储存近似的那个海森矩阵，这时L-BFGS就出现了，它每次是计算出要计算近似海森矩阵就好。详细的看下面的参考文献吧。

参考文献

Jacobian矩阵和Hessian矩阵
 【原创】牛顿法和拟牛顿法 – BFGS, L-BFGS, OWL-QN

关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。