牛顿法无约束优化

姑苏隐士

已于 2023-06-29 15:51:01 修改

阅读量1k

点赞数

分类专栏：工程计算与计算物理数值优化方法文章标签：矩阵算法数值优化

于 2021-12-22 23:07:29 首次发布

本文链接：https://blog.csdn.net/luzhanbo207/article/details/122097107

版权

数值优化方法同时被 2 个专栏收录

15 篇文章 35 订阅

订阅专栏

工程计算与计算物理

13 篇文章 7 订阅

订阅专栏

牛顿法

梯度法仅仅依赖函数值和梯度的信息，如果函数 $f (x)$ 充分光滑，则可以利用二阶导数信息构造下降方向 $d^k$ 。牛顿类算法就是利用二阶导数信息来构造迭代格式的算法。由于利用信息变多，牛顿法的实际表现要好于梯度法，但是它对函数 $f (x)$ 的要求也相应变高。

一、经典牛顿法
对于二次函数 $f (x)$ ，考虑 $f (x)$ 在点 $x^k$ 处的二阶泰勒展开
$f(x)=f(x^k)+\nabla f(x^k)^T(x-x^k)+(x-x^k)^T\frac{1}{2}\nabla^2f(x^k)(x-x^k) + o(||x-x^k||^2)\tag{1}$
对于（1）式忽略高阶项，极小化，根据一阶极小化的必要性条件，可以得到
$\nabla f(x^k)+\nabla^2f(x^k)(x-x^k)=0$
若 $\nabla^2f(x^k)$ 可逆，于是有
$x=x^k-(\nabla^2f(x^k))^{-1}\nabla f(x^k)$
从而可得经典牛顿法的迭代格式
$x^{k+1}=x^k-(\nabla^2f(x^k))^{-1}\nabla f(x^k) \tag{2}$
注意在经典迭代格式中，步长 $\alpha_k$ 恒为1，即可以不额外考虑步长的选取，我们也称步长为1的牛顿法为经典牛顿法。

我们这里不加证明给出经典牛顿法的局部收敛性
（1）如果初始点离 $x^*$ 足够近，那么牛顿法产生的点列 ${x^k\}$ 收敛于 $x^*$ ;
（2） ${x^k\}$ 收敛到点 $x^*$ 的速度是二次的
（3） $\{||\nabla f(x^k)||\}$ 二次收敛到0
上述性质表明经典牛顿法是收敛速度很快的算法，但它的收敛是有条件的：第一初始点 $x^0$ 必须距离问题的解充分近，即牛顿法只有局部收敛性，当 $x^0$ 距离问题的解较远时，牛顿算法在多数情况下会失效；第二，海塞矩阵 $\nabla^2f(x^*)$ 需要为正定矩阵；牛顿法适用于优化问题的高精度求解，但是它没有全局收敛性，因此在实际应用中，人们常会使用梯度类算法先求得较低精度的解，然后调用牛顿法来获得高精度的解。

二、修正牛顿法
尽管上节给出了经典牛顿法的迭代格式和收敛性质，在实际应用中这个迭代格式几乎时不能使用的，经典牛顿法有如下缺陷：
（1）每一步迭代需要求解一个 $n$ 维线性方程组，这导致在高维问题中计算量较大，海塞矩阵 $\nabla^2f(x^k)$ 既不容易计算又不容易存储；
（2）当 $\nabla^2f(x^k)$ 不正定时，牛顿方程给出的解的性质通常比较差
（3）当迭代点距离最优值较远时，直接选取步长 $alpha_k=1$ 会使得迭代机器不稳定，在有些情况下迭代点列会发散。
为了克服这些缺点，我们必须对经典牛顿法做出某些修正或者变形，使其成为真正可以使用的算法。这里介绍带线搜索的修正牛顿法，其基本思想是对牛顿方程中的海塞矩阵 $\nabla^2f(x^k)$ 进行修正，使其变成正定矩阵；同时引入线搜索以改善算法的稳定性；其算法迭代步骤如下

带线搜索的牛正牛顿法：
（1）给定初始点 $x^0$ ;
（2）for k=0,1,2,…do
（3）确定矩阵 $E^k$ 使得矩阵 $B^k=\nabla^2f(x^k)+E^k$ 正定且条件数小
（4）求解修正的牛顿方程 $B^k(d^k)=-\nabla f(x^k)$ ，得到下降方向 $d^k$
（5）使用任意一种线搜索准则确定步长 $\alpha_k$
（6）更行 $x^{k+1}=x^k+\alpha_kd^k$
（7）endfor