无约束最优化方法

x .y

已于 2022-12-02 18:57:44 修改

阅读量2.2k

点赞数 3

分类专栏：数学文章标签：算法数学

于 2022-10-30 16:09:20 首次发布

本文链接：https://blog.csdn.net/weixin_45102820/article/details/127599883

版权

数学专栏收录该内容

5 篇文章

订阅专栏

文章目录

无约束最优化问题
$\qquad f:R^n->R \qquad (1) \quad \quad \\\quad \quad \newline 求解(1)，就是找到R^n中的一点x^*，使得∀x∈R^n，\quad \quad \\\quad \quad \newline 均有f(x^*)≤f(x)，称x^*为(1)的全局极小点。 \newline$

最速下降法

在这里插入图片描述

收敛性定理：设f连续可微，水平集L={x | f(x) ≤ f(x^ 1)}，则最速下降法或者在有限步迭代后终止，或者得到点列{x^k}，其任何聚点都是f的驻点。
在收敛定理的假设下，若f 为凸函数，则最速下降法或在
有限迭代步后达到极小点，或得到点列其任何聚点都是
f 的极小点

最速下降法的两个特征

相邻两次迭代的搜索方向互相正交（锯齿现象）
对二元正定二次函数，用最速下降法产生的点列：偶数点列均在一条直线上，奇数点列也均在一条直线上，且都过最优点

最速下降法的改进：

选择不同初始点
采用不精确的一维搜索：采用非精确一维搜索求步长,
可使相邻两个迭代点处的梯度不正交，从而改变收敛性
采用加速梯度法：由于最速下降法在极小值点附近成锯齿状，因此下降过程中搜索方向可取
$d^k = x^k-x^{k-2}$
下两步继续用最速下降法，即负梯度方向

Newton法

在这里插入图片描述步骤3中的搜房方向，可通过求解下列方程组得到
$^2f(x^k)d^k+▽f(x^k)=0$

当 f 为正定二次函数时，用Newton法从任意初始点可一步
迭代达到极小点。
二次收敛性：从任意初始点出发，经有限次迭代总可以达到正定二次函
数的极小点，称这样的算法具有二次收敛性

Newton法的优点

当初始点离极小点很近时，算法收敛速度快
算法简单，不需要进行一维搜索
对正定二次函数，迭代一次就可得到极小点

Newton法的缺点

对多数问题算法不具有全局收敛性
每次迭代都要计算Hesse矩阵，计算量大
$每次迭代都要计算(▽^2f(x^k))^{-1} \\ \quad \newline 或求解方程组▽^2f(x^k)d+▽f(x^k)=0$

$(▽^2f(x^k))^{-1}可能不存在 \\ \quad \newline方程组是奇异的，病态的 \\ \quad \newline ▽^2f(x^k)非正定，d^k可能不是下降方向$

收敛于鞍点或极大点的可能性并不小

Newton法的改进

针对缺点(1) 对多数算法不具有全局收敛性，和 (4) 收敛于鞍点或极大点的可能性并不小，步长不取固定值1，而是采用精确一维搜索找最佳步长λk,这就是阻尼牛顿法
$minf(x^k+λd^k)$

Newton法的近一步改进
针对缺点(2)每次计算Hesse矩阵
在这里插入图片描述

共轭梯度法

在这里插入图片描述

共轭方向的性质

在这里插入图片描述

共轭方向法步骤
在这里插入图片描述

在这里插入图片描述

FR共轭梯度法
$a_k=\frac{||g_{k+1}||^2}{||g_k||^2}$

FR共轭梯度法的计算步骤

在这里插入图片描述

变尺度法

牛顿法和阻尼牛顿法收敛速度很快，但需要计算Hesse矩阵的逆，计算量大
为减少计算量，用一个n阶对称正定矩阵Hk近似代替Hesse矩阵的逆，搜索方向为pk = -Hkgk，由此产生的方法称为变尺度法，Hk为尺度矩阵，这是一种拟牛顿法

变尺度法的计算步骤

在这里插入图片描述

构造Hk的原则
1. 拟牛顿性质
2. 二次收敛性
3. 稳定性

Hk的构造策略

H1为任意一个n阶对称正定矩阵，通常选取n阶单位矩阵I
然后通过修正Hk，给出Hk+1
$H_{k+1} = H_k+△H_k$
构造不同的Hk，也就是构造不同的修正矩阵△Hk，得到不同的变尺度法

DFP算法

DFP算法构造的Hk：对称正定满足拟牛顿性质
$H_{k+1}△g_k = △x_k \\ \\ \quad \quad \newline H_{k+1} = H_k +α_ku^k(u^k)^T+β_kv^k(v^k)^T \\ \\\quad \quad \newline α_k、β_k是常数，u^k、v^k是n维列向量，H_1是对称正定的矩阵 \\ \\\quad \quad \newline H_{k+1}满足拟牛顿性质，H_{k+1}△g_k=△x_k \\ \\\quad \quad \newline α_ku^k(u^k)^T△g_k +β_kv^k(v^k)^T△g_k=△x_k-H_k△g_k\\ \\\quad \quad \newline u^k=△x_k，v^k=H_k△g_k\\ \\\quad \quad \newline 令α_k = \frac{1}{(△x_k)^T△g_k}，β_k=-\frac{1}{(△g_k)^TH_k△g_k}$