无约束优化最优性条件

最新推荐文章于 2024-03-09 14:18:27 发布

多情剑客无情剑yu

最新推荐文章于 2024-03-09 14:18:27 发布

阅读量1.2k

点赞数

分类专栏：最优化理论与方法文章标签：线性代数

本文链接：https://blog.csdn.net/qq_36175219/article/details/120958660

版权

最优化理论与方法专栏收录该内容

7 篇文章 0 订阅

订阅专栏

无约束优化最优性条件

1、一阶必要条件
2、二阶必要条件
3、二阶充分条件
4、无约束优化凸函数的极值点

1、一阶必要条件

定义1：设 $f (x)$ 在开集 $D$ 上连续可微，若 $~x^*\in D~$ 是 $~\min_{x\in\mathbb{R}^n}f(x)~$
的局部最优解，则 $g(x^*)=0~$

证明：任给 $~d\in\mathbb{R}^n~$ ,由局部最优解的定义，对任意充分小的数 $t > 0$ ,有
$~f(x^*)\le f(x^*+td)=f(x^*)+t\nabla f(x^*)^Td+o(t)~$
不等式的两端同时减去 $f(x^*)~$ 后除以 $t$ ,并令 $~t\rightarrow0^+~$ 可得 $~\nabla f(x^*)^Td\ge0,\forall d\in\mathbb{R}^n~$
特别地令 $~d=-\nabla f(x^*)~$ 得 $~~-\Vert \nabla f(x)\Vert^2=-~\nabla f(x^*)^T\nabla f(x^*)\ge0$ ,
从而 $~\nabla f(x)=0~$
注：我们称所求的点 $x^*~$ 为函数 $f$ 的稳定点(驻点)，上述结果也表明无约束优化的局部最优解必是目标函数的稳定点。

2、二阶必要条件

定义2：设 $f (x)$ 在开集 $D$ 上二阶连续可微，若 $~x^*\in D~$ 是 $~\min_{x\in\mathbb{R}^n}~$
的局部最优解，则 $g(x^*)=0~$ , $G(x^*)~$ 是半正定矩阵

证明： $g(x^*)=0~$ ,上面已经证明，我们只需证明 $G(x^*)~$ 半正定矩阵
任给 $~d\in\mathbb{R}^n~$ ,由局部最优解的定义，对任意充分小的数 $t$ ,有
$f(x^*)\le f(x^*+td)=f(x^*)+\frac{1}{2}t^2d^TG(x^*)d+o(t^2)$
不等式的两端同时减去 $f(x^*)~$ 后除以 $t$ ,并令 $~t\rightarrow0^+~$ 可得 $~p^TG(x^*)p\ge0~$ ,故 $G(x^*)~$ 半正定矩阵.
注：鞍点满足上述条件，但是鞍点既不是极大值点也不是极小值点。

3、二阶充分条件

定义3：设 $f (x)$ 在开集 $D$ 上二阶连续可微， $~x^*\in D~$ 是
$~\min_{x\in\mathbb{R}^n}f(x)~$
的局部极小值点的充分条件是 $g(x^*)=0~$ , $G(x^*)~$ 是正定矩阵
证明：对任意向量 $d$ 和 $~\varepsilon~$ ,有
$f(x^*+\varepsilon d)=f(x^*)+\frac{1}{2}d^TG(x^*+\theta\varepsilon d)d$
其中 $~\theta\in(0,1)~$ .由于 $G(x^*)~$ 正定和 $f (x)$ 二阶导数矩阵连续，故存在
$~\delta>0~$ ,使得 $~G(x^*+\varepsilon d)~$ 在 $~\Vert \varepsilon d\Vert\le\delta ~$
范围内正定，所以， $~f(x^*+\varepsilon d)>f(x^*)~$ ,从而定理成立

注： $G(x^*)~$ 的正定性保证了函数在 $x^*~$ 处是严格凸的， $g(x^*)=0~$ 保证函数
$f (x)$ 在 $x^*~$ 处是稳定点.

4、无约束优化凸函数的极值点

定义4：设凸函数 $f (x)$ 在开集 $D$ 上连续可微，则 $f$ 的局部极小值点也是其全局极小值点。而且， $x^*~$ 是问题
$~\min_{x\in\mathbb{R}^n}f(x)~$
的充要条件 $g(x^*)=0~$ .

证明：先证明 $f$ 的局部极值点也是全局极值点.设 $x^*~$ 是 $f$ 的局部极值点。则存在 $x^*~$ 一个邻域 $U(x^*)~$ ,使得
$f(x)\ge f(x^*),~~~\forall ~x\in U(x^*)$
对任意的 $~x\in\mathbb{R}^n~$ ,当 $~\alpha>0~$ 充分小时， $~x^*+\alpha (x-x^*)\in U(x^*)~$ ,则有
$f(x^*)\le f(x^*+\alpha(x-x^*))=f(\alpha x+(1-\alpha)x^*)\le \alpha f(x)+(1-\alpha)f(x^*)$
即有 $~f(x)\ge f(x^*)~$ ,故当 $f (x)$ 为凸函数时，局部极小值点也是全局极小值点。
再证 $f (x)$ 为凸函数， $x^*~$ 为极小值点的充要条件是 $g(x^*)=0~$ .
必要性由前面可知,是显然的。
由 $f (x)$ 在 $D$ 上为凸函数,即有
$f(x)\ge f(x^*)+g(x^*)^T(x-x^*)=f(x^*),~~~\forall x\in D$
这表明 $x^*~$ 为整体极小值点

参考书籍
《数值最优化算法与理论》——李董辉
注：参考了倪勤老师与袁亚湘老师的书籍，关于上面的定理的证明虽然本质都差不多，但是个人感觉有点繁琐，所以选择了李董辉老师书上的证明，简洁明了。