【优化方法】拟牛顿法之DFP算法

最新推荐文章于 2023-03-31 10:41:35 发布

菜小白—NLP

最新推荐文章于 2023-03-31 10:41:35 发布

阅读量3.9k

点赞数

分类专栏： ML

本文链接：https://blog.csdn.net/ACM_hades/article/details/90411750

版权

本文回顾了牛顿法的二阶收敛性及其求解Hessian矩阵的高复杂度问题，接着介绍了DFP（Davidon-Fletcher-Powell）拟牛顿法。DFP法通过上一步的信息模拟Hessian矩阵，避免直接计算，从而简化了牛顿法的计算过程。文章详细阐述了DFP算法的构造过程，包括如何利用梯度差和向量关系构建矩阵更新公式。

摘要由CSDN通过智能技术生成

一、牛顿法回顾

上一篇牛顿法(Newton Method)中介绍了牛顿法的基本思路，牛顿法具有二阶收敛性，相比较最速下降法，收敛的速度更快。
但是牛顿法也有一个缺点就是：求解Hessian矩阵复杂度比较大

1、下面是第k+1步的牛顿迭代：

对于函数 $f (X)$ ，其中 $X=[x_1,x_2,…,x_n ]^T$ 为向量。在牛顿法的求解过程中，首先是将 $f (X)$ 函数在 $X^{k+1}$ 处展开，并且令 $f (X)$ 函数在 $X^{k+1}$ 处的梯度为： $∇f(X^{k+1} )=[\frac{∂f}{∂x_1},\frac{∂f}{∂x_2},…,\frac{∂f}{∂x_n}]^T$
泰勒展开为： $f(X)=f(X^{k+1})+∇f(X^{k+1} )^T (X-X^{k+1})+\frac{1}{2} (X-X^{k+1} )^T G_{k+1} (X-X^{k+1})+⋯+o$
$G_{k+1}为X=X^{k+1}$ 的Hesse矩阵，省略高价无穷小量： $f(X)=f(X^{k+1})+∇f(X^{k+1} )^T (X-X^{k+1})+\frac{1}{2} (X-X^{k+1} )^T G_{k+1} (X-X^{k+1})$
对 $X$ 求导,并令导数为 $0$ ： $f(X)=∇f(X^{k+1} )^T+G_{k+1} (X-X^{k+1})=0$
求出 $X$ ：

最低0.47元/天解锁文章

菜小白—NLP

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
【优化方法】拟牛顿法之DFP算法

一、牛顿法回顾上一篇牛顿法(Newton Method)中介绍了牛顿法的基本思路，牛顿法具有二阶收敛性，相比较最速下降法，收敛的速度更快。但是牛顿法也有一个缺点就是：求解Hessian矩阵复杂度比较大1、下面是第k+1步的牛顿迭代：对于函数f(X)f(X)f(X)，其中X=[x1,x2,…,xn]TX=[x_1,x_2,…,x_n ]^TX=[x1,x2,…,xn]T为向量。在...
复制链接

扫一扫

专栏目录