【最优化】最新北航研究生最优化期末考试知识点概括

最新推荐文章于 2022-06-02 21:38:59 发布

稷殿下

最新推荐文章于 2022-06-02 21:38:59 发布

阅读量576

点赞数 1

分类专栏：最优化文章标签：最优化

本文链接：https://blog.csdn.net/qq_38904659/article/details/112503711

版权

最优化专栏收录该内容

10 篇文章 3 订阅

订阅专栏

前有学长精心的总结，在其基础上增加了部分内容，供大家参考！

文章目录

知识点总结
对数障碍函数
倒数障碍函数
二次罚函数
乘子罚函数
基本SQP法
判定一个点是不是KKT点
一阶条件
- 一阶必要条件
- 约束规范条件
二阶条件
- 二阶充分条件
- 二阶必要条件
对偶函数求法
积极集法
半定规划
参考资料

知识点总结

半定规划是一个非光滑 凸优化 问题
凸规划的 KKT 点是全局极小点
- 定理：凸规划的任意 KKT 点是全局极小点
目标函数 Hessian 阵半正定时，且约束为凸时为凸规划
将这些（通常是非光滑的）问题重新表述成光滑的优化问题常用技巧：

$\min_{x \in \mathbb{R}^n}~~f(x) \longleftrightarrow \begin{aligned} \min_{x\in\mathbb{R}^n,t\in \mathbb{R}} ~~& t\\ \mathrm{s.t.} ~~& f(x) \leq t \end{aligned}$

例 (a) $\| r(x) \|_{\infty}$ 可重述为
$\begin{aligned} \min_{x\in\mathbb{R}^n,t\in \mathbb{R}} ~~& t\\ \mathrm{s.t.} ~~& -t \leq r_i(x) \leq t,i=1,2,\cdots,m \end{aligned}$
(b) $\max\{r_i(x),i=1,2,\cdots,m\}$ 可重述为
$\begin{aligned} \min_{x\in\mathbb{R}^n,t\in \mathbb{R}} ~~& t\\ \mathrm{s.t.} ~~& r_i(x) \leq t,i=1,2\cdots,m \end{aligned}$
© $f(x) = \|r(x)\|_1$ 可重述为
$\begin{aligned} \min_{x\in\mathbb{R}^n,t\in \mathbb{R}^m} ~~& \sum_{i=1}^m t_i\\ \mathrm{s.t.} ~~& -t_i \leq r_i(x) \leq t_i,i=1,2,\cdots,m \end{aligned}$

线性规划是凸规划，其KKT点是全局最优点
求解二次规划的积极集法中，初始迭代 不是任意的 ，要是满足约束的可行点
二次（courant）罚函数中， 不能固定罚函数，当罚参数趋于 $+\infty$ 时由罚函数所得的原问题的近似解才是可行的。
增广 Lagrange 函数中，固定 Lagrange 乘子为与问题为与问题最优解对应的 Lagrange 乘子， 且二阶充分条件成立 ，则对充分大的罚参数，求增广Lagrange函数的极小点可得原问题的解。
$l_1$ 罚函数是精确罚函数
- 特点：不需要 $\sigma \rightarrow \infty$ ，避免了无约束优化问题的病态性；但是是非光滑的，带来数值计算上的困难
凸规划，且满足 Slater 约束规范，则强对偶性成立
- $\mathrm{Slater ~ CQ} + 凸规划 \Rightarrow 强对偶定理$
二次规划不一定是凸规划，需要 Hessian 矩阵半正定

对数障碍函数

$\phi(x,\mu) = f(x) - \mu \sum_i \log(-c_i(x))$

倒数障碍函数

$\phi(x,\mu) = f(x) - \mu \sum_i [c_i(x)]^{-1}$

二次罚函数

$\begin{aligned} \phi(x,\sigma) = & f(x) + \frac{1}{2}\sigma\sum_i(c_i(x))^2 \\ = & f(x) + \frac{1}{2}\sigma c(x)^Tc(x) \end{aligned}$

Lagrange 乘子估计为

$\lambda_i^{(k)} = \sigma_k c^{(k)}$

乘子罚函数

$\phi(x,\lambda,\sigma) = f(x) + \lambda^T c(x) + \frac{1}{2} \sigma c(x)^Tc(x)$

Lagrange 乘子估计为

$\lambda^{(k +1)} = \lambda^{(k)} + \sigma c_i^{(k)}$

基本SQP法

SQP 法中的二次规划子问题：

$\begin{aligned} \min_{s \in \mathbb{R}^n} ~~& \frac{1}{2} s^T W^{(k)} s + {g^{(k)}}^T s + f^{(k)} \\ \mathrm{s.t.}~~& {a_i^{(k)}}^Ts + c_i^{(k)} = 0, i \in \mathcal{E}\\ ~~& {a_i^{(k)}}^Ts + c_i^{(k)} \leq 0, i \in \mathcal{I} \end{aligned}$
其中：

$W^{(k)} = \nabla^2f(x^{(k)}) + \sum_i \lambda_i^{(k)} \nabla^2 c_i(x^{(k)})$
$s = x-x^{(k)}$ 是新定义的一个向量
$c_i$ 是把 $x$ 带入约束得到的值
$a_i$ 是在 $x$ 点处的约束的梯度

解出 $s$ 后， $x = s + x^{(k)}$

SQP 法失败，可能是由初值选取不当造成的

判定一个点是不是KKT点

在 $x^{\star}$ 满足
$\sum_{i=1}^n \lambda_i a_i$
解出乘子 $\lambda$ 非负，为 KKT 点

一阶条件

一阶必要条件

KKT 条件
$\begin{aligned} \nabla_x \mathcal{L}(x^*,\lambda^*) & = 0\\ c_i(x^*) & = 0, i \in \mathcal{E} \\ c_i(x^*) & \leq 0, i \in \mathcal{I} \\ \lambda_i^* &\geq 0, i \in \mathcal{I} \\ \lambda_i^*c_i(x^*) & = 0, i \in \mathcal{I} \end{aligned}$

约束规范条件

LCQ、LICQ条件

若满足 LCQ 或 LICQ 条件，则极小点必是 KKT 点

LCQ：在该点的等式约束和积极约束都是线性约束
LICQ：该点处的等式约束和积极约束的梯度线性无关（非零）

任意约束的 Lagrange 乘子的相反数均反映约束函数发生变化时所引起的最优值的变化率

二阶条件

二阶充分条件

计算积极约束的梯度 $a_i,i \in \mathcal{A}$
计算 Lagrange 函数的 Hessian 矩阵 $W$
根据 $p^Ta_i$ 的条件求出 $\in F^{\star}$
计算 $p^T W p$ ，若大于 0，则该点是局部解，否则不是

二阶充分条件： $x^{\star}$ 处KKT条件成立且
$p^T W p > 0$
则 $x^{\star}$ 是问题的严格局部极小点

二阶必要条件

$x^{\star}$ 是局部极小点
正则性假设成立
则存在乘子 $\lambda^{\star}$ 使得 KKT 条件成立

则
$p^T W p \geq 0$

对偶函数求法

若对偶函数有解析形式，步骤如下：

先写出 Lagrange 函数 $\mathcal{L}(x,\lambda)$
求出使 Lagrange 函数取极小值时的 $x$
把 $x$ 代回源 Lagrange 函数得到以 $\lambda$ 为变量的函数 $\varphi(\lambda)= \min_{x\in \mathbb{R}^n}~\mathcal{L}(x,\lambda)$ ，即为对偶函数
原问题为求最小值，对偶问题即为求最大值，对偶问题取最优值时的 $\lambda$ 为对应原问题取最优值时的 Lagrange 乘子

例考虑问题
$\begin{aligned} \min_{x\in\mathbb{R}^n} ~~& f(x) = c^T x \\ \mathrm{s.t.} ~~& Ax \geq b \\ ~~&x\geq 0 \end{aligned}$
分别基于集合约束 $x\in X=\{x\in\mathbb{R}^n | x\geq 0\}$ 和 $\in X = \mathbb{R}^n$ 写出该问题的对偶问题。

解 (a) Lagrange 函数为
$\begin{aligned} \mathcal{L}(x,\lambda) &= c^Tx + \lambda^T(b - Ax)\\ &=(c^T-\lambda^TA)x + \lambda^Tb \end{aligned}$
记对偶函数为
$\varphi(\lambda) = \min_{x\geq 0}~\mathcal{L}(x,\lambda)$
因此，需要 $c^T - \lambda^TA\geq 0$ ，则对偶函数为 $\varphi(\lambda) = b^T\lambda$ 。

对偶问题
$\begin{aligned} \max_{x \geq 0} ~~& b^T\lambda \\ \mathrm{s.t.} ~~& \lambda^TA\leq c^T \\ ~~&\lambda\geq 0 \end{aligned}$
(b) Lagrange 函数为
$\begin{aligned} \mathcal{L}(x,\lambda) &= c^Tx + \lambda^T(b - Ax) + \mu(-x)\\ &=(c^T-\lambda^TA - \mu^T)x + \lambda^Tb \end{aligned}$
记对偶函数为
$\varphi(\lambda) = \min_{x\in \mathbb{R}^n}~\mathcal{L}(x,\lambda)$
因此，需要 $c^T - \lambda^TA - \mu^T = 0$ ，则对偶函数为 $\varphi(\lambda) = b^T\lambda$ 。

对偶问题
$\begin{aligned} \max_{x\in\mathbb{R}^n} ~~& b^T\lambda \\ \mathrm{s.t.} ~~& \lambda^TA +\mu^T = c^T \\ ~~&\lambda\geq 0,\mu\geq 0 \end{aligned}$
注记：由此题体会写对偶问题的灵活性，即通常仅把难处理的约束松弛到目标函数中形成 Lagrange 函数，这样对偶问题的变量要少一些. 但是求对偶函数时可能要稍微复杂些。显然，两个问题的是等价的。

积极集法

对问题
$\begin{aligned} \min_{x\in\mathbb{R}^n} \quad q(x) &= \frac12x^TGx+d^Tx \\ \text{s.t.}\quad a^T_ix& = b_i, \quad i\in \mathcal A \end{aligned}$
考虑第 $k$ 次迭代， $x^{(k)}$ 是可行点， $\mathcal{A}^{(k)}$ 是积极集。

令 $s = x - x^{(k)}$ ， $g^{(k)} = \nabla q(x^{(k)}) = Gx^{(k)} + d$ ，则得优化问题
$\begin{aligned} \min_{s\in\mathbb{R}^n} \quad q(x) &= \frac12 s^TGs+{g^{(k)}}^Ts \\ \text{s.t.}\quad a^T_is& = 0, \quad i\in \mathcal A \end{aligned}$

解该问题得 $s^{(k)}$ ，乘子为 $\lambda^{(k)}$
若 $\lambda^{(k)}$ 有负， 删除最负的分量对应的约束
在新的约束的条件下，求取得目标函数最小值 $s^{(k)}$ ，作为搜索方向 $p$ 。
步长 $\alpha_k=\min \left( 1,\min_{i\notin\mathcal A^{(k)}, a_i^Tp^{(k)}<0} \frac{b_i-a^T_ix^{(k)}}{a^T_ip^{(k)}}\right)$ ，新的点为 $x^{(k+1)}=x^{(k)}+\alpha_kp^{(k)}$
迭代直到 Lagrange 乘子没有负

有效集法介绍（Active Set Method）

半定规划

形如：

$\begin{array}{cl}{{\operatorname{min}}} & {C \cdot X} \\ {\text { s.t. }} & {A_{i} \cdot X=b_{1}} \\ {} & {X \geq 0}\end{array}$
对偶：

$\begin{aligned}{{\operatorname{max}}} ~~& {\sum_{i=1}^{m} y_{i} b_{i}} \\ {\text { s.t.}} ~~& {\sum_{i=1}^{m} y_{i} A_{i}+S=\mathbf{C}} \\ {} & {S \geq 0}\end{aligned}$
举例：
$\begin{aligned}{\text { max }}~~ & {11 y_{1}+19 y_{2}} \\ {\text {s.t. }}~~ & {y_{1}\left[\begin{array}{ccc}{1} & {0} & {1} \\ {0} & {3} & {7} \\ {1} & {7} & {5}\end{array}\right]+y_{2}\left[\begin{array}{ccc}{0} & {2} & {8} \\ {2} & {6} & {0} \\ {8} & {0} & {4}\end{array}\right]+S=\left[\begin{array}{ccc}{1} & {2} & {3} \\ {2} & {9} & {0} \\ {3} & {0} & {7}\end{array}\right]} \\ {} & {S \geq 0}\end{aligned}$

参考资料

[1] 有效集法介绍（Active Set Method）

[2] 北航研究生课程最优化方法期末知识点总结

[3] 刘红英，夏勇，周永生. 数学规划基础，北京，北京航空航天大学出版社，2012.

稷殿下

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
【最优化】最新北航研究生最优化期末考试知识点概括

前有学长精心的总结，在其基础上增加了部分内容，供大家参考！文章目录知识点总结对数障碍函数倒数障碍函数二次罚函数乘子罚函数基本SQP法判定一个点是不是KKT点一阶条件一阶必要条件约束规范条件二阶条件二阶充分条件二阶必要条件对偶函数求法积极集法半定规划参考资料知识点总结半定规划是一个非光滑凸优化问题凸规划的 KKT 点是全局极小点定理：凸规划的任意 KKT 点是全局极小点目标函数 Hessian 阵半正定时，且约束为凸时为凸规划将这些（通常是非光滑的）问题重新表述成光滑的优化问题常用
复制链接

扫一扫

专栏目录