最优化学习拟牛顿法（Quasi-Newton Method）

最新推荐文章于 2023-10-20 19:27:17 发布

风信子的猫Redamancy

最新推荐文章于 2023-10-20 19:27:17 发布

阅读量1.5w

点赞数 7

分类专栏：最优化理论学习推导

本文链接：https://blog.csdn.net/weixin_45508265/article/details/117400567

版权

最优化理论学习推导专栏收录该内容

14 篇文章

订阅专栏

拟牛顿法是一种解决非线性优化问题的迭代方法，通过近似Hessian矩阵来加速梯度下降。本文介绍了DFP和BFGS两种经典的rank-2校正方法，以及SR-1的rank-1校正策略。这些算法利用矩阵更新来逼近Hessian，从而提高求解效率。Sherman-Morrison公式在Broyden类算法中起到关键作用，用于矩阵的快速修正。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

拟牛顿法（Quasi-Newton Method）

全部笔记的汇总贴：最优化学习目录

拟牛顿法（Quasi-Newton Method）

$\text{Quasi−NewtenMethod } d^{k}=-B^{-1} \nabla f\left(x^{k}\right)$
在这里插入图片描述

得到矩阵 $B_{k+1}$

$\text{拟牛顿方程 :}$ $\nabla f\left(x^{k+1}\right)-\nabla f\left(x^{k}\right)=B_{k+1}\left(x^{k+1}-x^{k}\right)$ $y_{k}=\nabla f\left(x^{k+1}\right)-\nabla f\left(x^{n}\right)$ $s_{k}=x^{k+1}-x^{k}$
这样我们就可以得到 $y_{k}=B_{k+1}s_{k}$ ，记 $H_{k+1}=(B_{k+1})^{-1}$
在这里插入图片描述

获取 $B_{k+1}$ 和 $H_{k+1}$

第一类方法：选择满足拟牛顿方程且与 $B_{k}$ 近似的矩阵
第二类方法：对 $B_{k}$ 或 $H_{k}$ 进行校正，如 $B_{k+1} = B_{k} + \Delta B$
- rank-2 校正 $\Delta B$ 秩为2 DFP方法,BFGS方法
- rank-1 校正 $\Delta B$ 秩为1 SR-1方法

在这里插入图片描述

DFP方法(Davidon-Fletche Powell)

可以看作是rank-2校正
$H_{k+1}=H_{k}-\frac{H_{k} y_{k} y_{k}^{T}H_{k}}{y_{k}^{\top} H_{k} y_{k}}+\frac{s_{k} s_{k}^{\top}}{y_{k}^{\top} s_{k}}$
在这里插入图片描述

BFGS方法(Broyden-Fletcher-Goldfarb-Shannon)

可以看作是rank-2校正
$B_{k+1}=B_{k}-\frac{B_{k} s_{k} s_{k}^{\top} B_{k}}{s_{k}^{\top} B_{k} s_{k}}+\frac{y_{k} y_{k}^{\top}}{y_{k}^{\top} s_{k}}$

在这里插入图片描述

Broyden类算法和Sherman-Morrison公式

Sherman-Morrison公式：
假设 $A$ 是 $n$ 阶可逆矩阵, $u, v$ 是 $n$ 维向量，且 $\left(A+u v^{T}\right)$ 也是可逆矩阵，则
$\left(A+u v^{T}\right)^{-1}=A^{-1}-\frac{A^{-1} u v^{T} A^{-1}}{1+v^{T} A^{-1} u}$