最优化（一）数学基础

最新推荐文章于 2023-02-07 23:26:19 发布

程勇uestc

最新推荐文章于 2023-02-07 23:26:19 发布

阅读量1.7k

点赞数

分类专栏：最优化理论和实践文章标签：最优化

本文链接：https://blog.csdn.net/qq_40438165/article/details/100540039

版权

最优化理论和实践专栏收录该内容

0 篇文章 1 订阅

订阅专栏

1、等值线

$\quad$ 定义：在高维空间 $n\geq3$ 中，使目标函数值取同一常数的点集 ${X|f(X)=c,c为常数\}$ 称为 $f (X)$ 的等值线。
对于连续的单值函数，其等值线具有以下性质：

不同的等值线不想交
除极值点所在的等值线外，等值线不会中断
等值线稠密的地方，目标函数值变化较快
在极值点附近，等值线近似呈同心椭圆簇

2、可微与梯度

$\quad$ 定义：设 $f:D⊂R^n,且X^0\in D$ ，若存在 $n$ 维向量 $L$ ，对任意 $n$ 维向量 $P$ ，都有 $lim_{||P||->0}\frac{f(X^0+P)-f(X^0)-L^TP}{||P||}=0$ 则称 $f (X)$ 在 $X^0$ 可微。(直观理解为：分子趋于0的速度比分母快。根据定义可以解出 $L=(\frac{\partial f(X^0)}{\partial x_1},\frac{\partial f(X^0)}{\partial x_2},\cdots,\frac{\partial f(X^0)}{\partial x_n})^T$
$\quad$ 梯度：依次以 $f (X)$ 的 $n$ 个偏导数为分量的向量 $\nabla f (X)$ 称为 $f (X)$ 的梯度。 $\nabla f (X) = L$ 。引入梯度后， $f(X^0+P)=f(X^0)+∇f(X^0)P+o(||P||)$ 。梯度性质如下：

若 $∇f(X^0)\neq0$ ，则 $f(X^0)$ 与过 $X^0$ 的等值线垂直
沿梯度方向函数具有最大的变化率
$∇(b^TX)=b,b=(b_1,b_2,\cdots,b_n)^T\in R^n$
$X^TX)=2X$
$X^TAX)=2AX$ ，这里 $A=A^T$
$X^TAX)=AX+A^TX$

3、方向导数

$\quad$ 定义：设 $P\in R^n,||P||=1$ ，可微函数 $f (X)$ 在 $X$ 点沿 $P$ 的方向导数为: $\frac{d(f(X))}{d(P)}=\lim_{\alpha->0^+}\frac{f(X+\alpha P)-f(X)}{||\alpha P||}=\lim_{\alpha->0^+}\frac{∇f(X)^T(\alpha P)+o(||\alpha P||)}{||\alpha P||}=∇f(X)^TP=||∇f(X)||cos(∇f(X),P)$ 其中， $\nabla f (X), P$ 表示 $\nabla f (X)$ 和 $P$ 的夹角。可见要使函数值下降最快，需要使得 $c o s (\nabla f (X), P) = - 1$ ，即 $P=-\beta ∇f(X)$ 。沿着负梯度的方向函数值下降得最快。

4、Hesse矩阵

$\quad$ 定义：函数 $f (X)$ 具有二阶连续偏导数，则对 $f (X)$ 求二阶偏导得到的矩阵是Hesse矩阵，一定是对称矩阵。
$∇^2f(X)=\begin{matrix} \frac{\partial^2 f(X)}{\partial x_1^2}& \frac{\partial^2 f(X)}{\partial x_2\partial x_1} & \cdots & \frac{\partial^2 f(X)}{\partial x_n\partial x_1} \\ \frac{\partial^2 f(X)}{\partial x_1\partial x_2} & \frac{\partial^2 f(X)}{\partial x_2^2} & \cdots & \frac{\partial^2 f(X)}{\partial x_n\partial x_2}\\\cdots & \cdots & \cdots & \cdots \\ \frac{\partial^2 f(X)}{\partial x_1\partial x_n} & \frac{\partial^2 f(X)}{\partial x_2x_n} & \cdots & \frac{\partial^2 f(X)}{\partial x_n^2} \end{matrix}$

5、极小点与最优值

$\quad$ 对于点 $X^*$ 邻域内任意点 $X$ ，都满足 $f(X^*)\leq f(X)$ ，则 $X^*$ 为 $f (X)$ 的局部极小点， $f(X^*)\le f(X)$ ，则 $X^*$ 为 $f (X)$ 的严格局部极小点。函数值 $f(X^*)$ 称为最优值。

6、驻点、极值点、鞍点和拐点

驻点：若 $f(X^*)=0$ ，则 $X^*$ 为 $f(X^*)$ 的驻点
极值点：若 $f(X^*)=0$ ，且 $^2f(X^*)$ 是正定矩阵，则 $X^*$ 是 $f (X)$ 的严格局部极小点(若 $^2f(X^*)$ 是半正定矩阵，其他条件不变，那么 $X^*$ 不一定是 $f (X)$ 的局部极小点，也可能是鞍点)
鞍点：是驻点而不是极值点的点统称为鞍点
拐点：函数凹凸性改变的变

7、凸集和凸函数

$\quad$ 凸集：若集合D中任意两点连线仍在D中，则D为凸集
$\quad$ 凸函数：设D是凸集，若对所有的 $X^1,X^2\in D,\alpha\in(0,1)$ ，都有 $f(\alpha X^1+(1-\alpha)X^2)\leq \alpha f(X^1)+(1-\alpha)f(X^2)$ 则 $f (X)$ 为D上的凸函数。
$\quad$ 凸函数充要条件：设D是凸集， $f (X)$ 在D上具有连续的二阶偏导数，则 $f (X)$ 在D上是凸函数的充要条件是 $^2f(X)$ 是半正定矩阵。

8、凸优化

局部最优解为全局最优解
最优解集为单点集

程勇uestc

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
最优化（一）数学基础

最优化内容数学基础线性规划从2维到n维，统一的方法对偶线性规划无约束的非线性规划最速下降法牛顿法等有约束的最优化搜索最优化问题\quad在众多可能的解中找出最佳决策，数学上来说就是找出函数极值。一般只能求到极小值，很难求到最小值，不过凸函数可以求最小值，比如线性规划就是凸函数。...
复制链接

扫一扫