Convex optimization 3.1 --- 凸优化问题 part1

最新推荐文章于 2023-11-01 09:02:11 发布

expectmorata

最新推荐文章于 2023-11-01 09:02:11 发布

阅读量4.9k

点赞数

分类专栏： # CVX MATH 文章标签： optimization

本文链接：https://blog.csdn.net/weixin_43485943/article/details/116000208

版权

MATH 同时被 2 个专栏收录

23 篇文章 6 订阅

订阅专栏

CVX

8 篇文章 1 订阅

订阅专栏

1 introduction

在前面两个章节，回顾了凸集、凸函数、凸集和凸函数联系。从这章开始认识凸优化问题。
其中，关于各种典型的类别的凸优化问题，主要参考了[2]。

2 凸优化问题

2.1 优化问题的标准形式

在这里插入图片描述

2.1.1 优化问题的最优解

优化问题的最优解
在这里插入图片描述
解集可能存在两种极端情况

2.1.2 优化问题的解集

可行解
如果 $x_i$ 满足 $f_i(x)、h_i(x)$ ，则称 $x_i$ 是可行解。
最优解
如果 $x_i$ ,使得 $f_0(x_i)=p*$ ,则称 $x_i$ 是最优解。
局部最优解
在z附近的局部区域， $x_i$ 是最优解，对于整个优化问题来说，是局部最优解。

2.1.3 常见问题的最优解

下面三个是典型的一维优化问题的最小值和最优解。
在这里插入图片描述

2.1.4 隐式和显式约束

显式约束
$f_i和h_i是显式约束$
隐式约束

2.1.5 可行性问题

对 $f_0(x)$ 并没有目标要求，设置成 $f_0(x)=0$
在这里插入图片描述

2.2 凸优化问题

对于一般的优化问题，要求解，目前我们已经学过的方法是求导和画图迭代求解。
在这里插入图片描述

及其重要的性质是：凸优化问题的解集是凸集。
根据上面学的凸函数交集或拟凸函数的下水平集仍然是凸集，可以得到这一结论。

example

2.3 凸优化问题的特性

2.3.1 任何局部最优解都是全局最优解

根据[1],证明非常简单，设X是局部最优解，y是全局最优解，那么在 $∣ ∣ z - x ∣ ∣ < R$ 的区间里，根据凸函数的性质得到 $f_0(z)<f_0(x)$ ，很容易推出矛盾。
在这里插入图片描述

2.3.2 从支撑超平面判定最优解

在这里插入图片描述
从图上很容易理解这样的关系，但是问题在于，很难利用这个条件去计算最优解。
$\bigtriangledown f_0(x)^T(y-x)$ 定义了支撑平面，说明了任意的 $\in X$ 都在支撑平面的一侧，不管如何从 $\to y$ 在 $\bigtriangledown f_0(x)$ 这个方向上都是增加的。
在这里插入图片描述

2.3.3 其他情况下最优解的求解

无约束情况下
无约束情况，采用类似于函数求极值的方法。
只有等式约束情况下
根据几何图像，很容易得到Ax=b对应的平面是 $f_0(x)$ 的支撑超平面。
有 $\bigtriangledown f_0(x) \perp \mathcal{N}(A)$ ,从拉格朗日算子描述为
存在 $\nu \in R^P, 使得 \bigtriangledown f_0(x)+A\nu=0$
只有非负约束
$\color{red}{看不懂}$

2.3.4 等价的凸问题

消除等式约束
增加等式约束
这个就比较容易理解，上面的逆操作
松弛变量
如果不等式约束是线性的
上镜图形式
极小化部分变量
极小化凸函数保持凸性不变， $min \inf(f_0(x_1,x_2)) 等价于 min f_0(x_1, x_2)$ 。
类似于极小化部分变量，先从每个部分找最小值，然后通过相互比较，找到全局最小值。

2.3.5 各种典型的凸优化问题

下图是各种典型凸优化问题之间的联系，在回顾各种典型的凸优化问题时，重点关注各种不同的凸优化问题之间的联系。
在这里插入图片描述

2.4 拟凸优化

2.4.1 定义

优化问题的基本结构仍然不变，因为拟凸函数的解集是凸集，所以 $f_i(x)和h_i(x)$ 的要求是相似的.
在这里插入图片描述
当 $f_0(x)$ 是拟凸函数时，问题变成了一个拟凸优化问题。

2.4.2 和凸优化问题的区别

在深入分析之前，需要先从几何直觉上回顾一下拟凸函数和凸函数的最大区别。
在这里插入图片描述

局部极小值不是全局最小值
支撑超平面判定最优解

2.4.3 二分法求拟凸优化问题

拟凸函数的下水平集是凸集，对应凸函数约束如下
在这里插入图片描述
拟凸优化问题中的极小值p*,极小值是通过二分法试出来的。
先设一个 $t_0, t_1$ 如果 $t_0$ 有解， $t_1$ 无解，则 $t_1<p*<t_0$ ,然后不断二分迭代，直到满足精度要求。

3 线性规划问题

进入这一部分，定义并不是非常难， $\color{red}{关键在于可视化的理解这些实际优化问题}$

3.1 定义

在这里插入图片描述
通过找到支撑平面，很快就能找到最优解。

3.2 问题转换

3.2.1 标准形式的LP

$\left\{ \begin{aligned} &minimize \quad &c^Tx \\ &subject to \quad &Ax=b \\ & \quad & x\geq 0 \end{aligned} \right.$
转换成标准形式[2]
在这里插入图片描述

3.3 典型问题

优化问题如果建模完成了，都有很成熟的工具箱，关键在于将其建模成典型的优化问题。

食谱问题
用数学形式描述为：
多面体的切比雪夫中心
在下面这个多边形区域中，找到一个半径最大的球。
不等式约束： $\vec{a}^T\vec{x} \preceq \vec{b}$
等式约束： $\{\vec{x_c}+\vec{u}| ||u||_2<r\}$
现在的问题在于，变量空间应该是 $x_c,r$ 这两个变量，所以需要对不定式约束进行改造。
$\begin{aligned} \vec{a}^T\vec{x} &=\vec{a}^T(\vec{x_c}+\vec{u}) \\ &\preceq \vec{a}^T\vec{x_c}+r||\vec{a}||_2 \end{aligned}$
问题就简化成下面这个线性规划问题

在这里插入图片描述

线性分式规划
如果 $f_0(x)是$ 线性分式函数

令 $e^Tx+f=\frac{1}{z}, zx=y$ ,很容易得到线性规划的形式

4 二次优化问题

4.1 定义

在这里插入图片描述
其中，P是正定矩阵 $\in S_+^n$ ,显然 $f_0(x)和f_i(x)$ 都是凸函数。
$x^TPx+q^Tx+r$ ，如果P是正定矩阵，二维二次方程的等高线图像如下：

二次优化问题的解集和方程的关系如下图。

4.2 典型例子

最小二乘问题

进行转换
$\left \{ \begin{aligned} & minimize \quad & x^TA^TAx-2b^TAx+b^Tb \\ & subject \quad & -x+l \leq 0 \\ & \quad & x-u \leq 0 \end{aligned} \right.$

5 QCQP(Quadratically Constrained Quadratic Programs)

5.1 定义

标准形式
在这里插入图片描述
从二维图像上理解QCQP问题，如下图。

5.2 典型问题

5.2.1 min linear function over a centered ellipsoid

问题描述
$\left \{ \begin{aligned} & minimize \quad &c^Tx \\ & subject \quad & x^TAx \leq 1, A \in S_+^n \end{aligned} \right.$
对问题进行简化,设 $y=A^{\frac{1}{2}}x, \bar{c}=A^{-\frac{1}{2}}c$
$\left \{ \begin{aligned} & maximum \quad &-\bar{c}^Ty \\ & subject \quad & y^Ty \leq 1 \end{aligned} \right.$
根据柯西-施瓦茨公式
$\begin{aligned} -\bar{c}^Ty &\leq \sqrt{\bar{c}^T\bar{c}} \sqrt{y^Ty} \end{aligned}$
当 $y=\alpha \bar{c}$ ,有最大值。根据constraints计算 $\alpha$ .
$y^Ty=\alpha^2\bar{c}^T\bar{c}\leq 1$
有 $\alpha=\frac{1}{\sqrt{\bar{c}^Tc}}$ ,
$\begin{aligned} x &=A^{-\frac{1}{2}}y \\ & =-\alpha A^{-\frac{1}{2}} A^{-\frac{1}{2}}c \\ & = -\frac{1}{\sqrt{c^TA^{-1}c}}A^{-1}c \end{aligned}$

5.2.2 min quadratic function over a centered ellipsoid

问题描述：
$\left \{ \begin{aligned} & minimize \quad & x^TBx \\ & subject \quad & x^TAx \leq 1 \end{aligned} \right.$
通过设 $y=A^{\frac{1}{2}}x, C=A^{-\frac{1}{2}}BA^{-\frac{1}{2}}$ ，问题转换成
$\left \{ \begin{aligned} & minimize \quad & y^TCy \\ & subject \quad & y^Ty\leq1 \end{aligned} \right.$
C是正定矩阵，有 $Cv=\lambda v$ 。如果 $\lambda_{min}<0$ ,当 $y=v_{min},得到最小值$
$y^TCy=-||\lambda_{min}|| v_{min}^Tv_{min}\leq -||\lambda_{min}||$
如果 $\lambda_{min}>0$ ,y=0的时候，得到最小值。

6 SOCP（二阶锥规划）

6.1 定义

在这里插入图片描述
关注inequalities,进行转换
$x^TA_i^TA_ix+(2b_i^TA_i-c_i^T)x+b_i^Tb_i-d_i \leq 0$
实际上是一个二项式， $A_i^TA_i$ 是正定矩阵。

6.2 QCQP和SOCP的关联

QCQP的标准形式：
$\left \{ \begin{aligned} & minimize \quad & x^TPx+x^Tq+r \\ & subject \quad & x^TP_i+x^Tq_i+r_i \leq 0 \end{aligned} \right.$
设 $f(x)=x^TPx+x^Tq+r\leq c$ ,进行转换得到：
$\left \{ \begin{aligned} & minimize \quad & c \\ & subject \quad & x^TP_i^{\frac{1}{2}}P_i^{\frac{1}{2}}x+2x^TP_i^{\frac{1}{2}}b_i+b_i^Tb_i-b_i^Tb_i+r_i \leq0 \\ & \quad & x^TP^{\frac{1}{2}}P^{\frac{1}{2}}x+2x^TP^{\frac{1}{2}}b+b^Tb-b^Tb+r \leq c \end{aligned} \right.$
设 $\bar{A}=[A \quad 0]$ , $\quad 1]$ , $\bar{x}=[x \quad c]^T$ , $\bar{A_i}=[A_i \quad 0]$ , $\bar{A}=[A \quad 0]$
$\left \{ \begin{aligned} & minimize \quad & f\bar{x} \\ & subject \quad & ||P_i^{\frac{1}{2}}\bar{x}+b||_2^2 \leq \sqrt{b_i^Tb_i-r_i} +c_i^Tx \\ & \quad & ||P^{\frac{1}{2}}x+b||_2 \leq \sqrt{c+b^Tb-r}\leq \sqrt{d+b^Tb-r} \\ & \quad & c \leq d \end{aligned} \right.$
最后是可以凑出SOCP的形式。

6.3 robust linear programming和SOCP的联系

问题的描述
$\left \{ \begin{aligned} & minimize \quad & c^Tx \\ & subject \quad & a_i^Tx \leq b_i, i=1,...,m \\ & \quad & a_i \in \epsilon_i : \{a_i +p_iu; ||u|| \leq 1\} \end{aligned} \right.$
robust 的问题，很多时候需要考虑的是极限情况下，是否满足约束。
$\left \{ \begin{aligned} & minimize \quad & c^Tx \\ & subject \quad & sup \{a_i^Tx|a_i \in \epsilon_i \} \leq b_i \end{aligned} \right.$
单独分析极限情况下的constraints
$\begin{aligned} sup \{a_i^Tx| a_i \in \epsilon_i \} &= sup \{(a_i+p_iu)^Tx | ||u|| \leq 1 \} \\ &=sup \{ a_i^Tx+u^Tp_i^Tx | ||u||\leq 1 \} \\ &=a_i^Tx+sup \{ u^Tp_i^Tx| ||u||\leq 1 \} \\ & =a_i^Tx+||p_i^Tx||_2 \leq b_i \end{aligned}$
当 $u=\frac{p_i^Tx}{||p_i^Tx||}$ 能获得最大值。此时就可以将robust linear programming 转换成SOCP问题
$\left \{ \begin{aligned} & minimize \quad & c^Tx \\ & subject \quad & ||p_i^Tx||_2 \leq -a_i^Tx+b_i \end{aligned} \right.$

6.4 linear programming with random constraints

这些都属于控制和规划中的常见的情况，从socp的角度理解这些形式。
$\left \{ \begin{aligned} & minimize \quad & c^Tx \\ & subject \quad & a_i^Tx \leq b_i, i=1,...,m \\ & \quad & a_i \sim \eta(\bar{a_i}, \xi_i) \end{aligned} \right.$

设定满足constraints的置信度，进行转换
$\left \{ \begin{aligned} & minimize \quad & c^Tx \\ & subject \quad & P_i(a_i^Tx \leq b_i)\geq \eta, i=1,...,m \end{aligned} \right.$

从constraints出发，令 $u=a_i^Tx$
$\begin{aligned} E(u) &=E(a_i)x =\bar{a_i}x \\ var(u) & =E(u) =x^T\xi x \\ P_i(a_i^Tx \leq b_i) &=\phi_i(z\leq\frac{b_i-\bar{u}}{\sigma_u}) \\ &= \int_{-\infty}^{\frac{b_i-\bar{u}}{\sigma_u}}\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}dx \end{aligned}$

根据概率限制,计算u所能取得范围
$\begin{aligned} \frac{b_i-\bar{u}}{\sigma_u} & \geq \phi^{-1}(\eta) \\ \bar{u}+\phi^{-1}(\eta)\sigma_u & \leq b_i \\ a_i^Tx+||\xi_i^{1/2}x||\phi^{-1}(\eta) & \leq b_i \end{aligned}$

就将概率形式的不等式约束转换成常规的不等式约束了
$\left \{ \begin{aligned} & minimize \quad & c^Tx \\ & subject \quad & ||\xi_i^{1/2}x||\leq -\frac{a_i^Tx}{\phi^{-1}(\eta)}+\frac{b_i}{\phi^{-1}(\eta)} \end{aligned} \right.$

在这里插入图片描述

6.5 sum of norms minimization

形式如下，凸函数的和仍然是凸函数，同时它可以转换成SOCP问题，所以不用担心这个问题是否是凸优化问题。
$\mathop{min}\limits_{x} \sum \limits_{i=1}^{p}||A_ix+b_i||_2$

使用技巧，设 $A_ix+b_i ||_2 \leq t_i$
$\left \{ \begin{aligned} & minimize \quad & \sum t_i \\ & subject \quad & ||A_ix+b_i||_2 \leq t_i, t=1,...,p \end{aligned} \right.$

为了凑出SOCP的形式，
设 $\bar{x}=[x_1 \quad x_2 \quad ... \quad x_n| \quad t_1 \quad t_2 \quad ... \quad t_p]$ ,
$\quad 0 \quad ... \quad 0| \quad 1 \quad 1 \quad ... \quad 1]$
$\bar{A_i}=[A_i \quad 0]$
$c_i=[0 \quad... \quad 1 \quad ... \quad 0 ]$ ,第i项为1.
$\left \{ \begin{aligned} & minimize \quad & f^T\bar{x}\\ & subject \quad & ||\bar{A}_ix+b_i||_2 \leq c_i^Tx, t=1,...,p \end{aligned} \right.$

6.6 max of norm minimization

凸函数集的最大值从几何上看是，凸函数上境图的交集，所以仍然是凸函数。同时它可以转换成SOCP问题，也就解决了证明是凸函数的困难。
$\mathop{min}\limits_{x} \mathop{max} \limits_{i} ||A_ix+b_i||$
设 $\mathop{max} \limits_{i}|| A_ix+b_i ||\leq t$
$\bar{x}=[x_1 \quad x_2 \quad ... \quad x_n \quad t]$
$\quad 0 \quad ... \quad 0 \quad 1]$
$c_i=[0 \quad 0 \quad ... \quad 0 \quad 1]$
$\bar{A_i}=[A_i \quad 0]$
转换成标准形式
$\left \{ \begin{aligned} & minimize \quad & f^T\bar{x}\\ & subject \quad & ||\bar{A}_ix+b_i||_2 \leq c_i^Tx, t=1,...,p \end{aligned} \right.$

6.7 problem with hyperbolic constraints

这种分式形式的双曲线函数是凸函数，凸函数之和仍然是凸函数。
$\left \{ \begin{aligned} & minimize \quad & \sum \limits_{i=1}^{p} \frac{1}{a_i^Tx+b_i} \\ & subject \quad & a_i^Tx+b_i \geq 0 \\ & \quad & c_i^Tx+d_i \geq 0 \end{aligned} \right.$
采用旧套路，设 $\frac{1}{a_i^Tx+b_i}\leq t_i$
根据
$w^2\leq xy \Longrightarrow ||[2w \quad x-y] ||_2\leq x+y$

转换成新的形式
$\left \{ \begin{aligned} & minimize \quad & \sum t_i\\ & subject \quad & || [2 \quad t_i -a_i^Tx-b_i]^T ||_2\leq a_i^Tx+b_i+t_i \\ & \quad & c_i^Tx+d_i \geq 0 \end{aligned} \right.$
和前面的内容类似，设
$\bar{x}=[x_1 \quad x_2 \quad ... \quad x_n | \quad t_1 \quad t_2 \quad ... \quad t_p]$
$\quad 0 \quad ... \quad 0 | \quad 1 \quad 1 \quad ... \quad 1]$
$\bar{A_i}= \begin{bmatrix} 0 & 0 \\ -a_i & e_i \end{bmatrix}$
$\bar{b_i}=[2 \quad -b_i]^T$
得到最终形式
$\left \{ \begin{aligned} & minimize \quad & f^T\bar{x}\\ & subject \quad & || \bar{A_i}x+\bar{b_i} ||_2\leq a_i^Tx+b_i+t_i \\ & \quad & c_i^Tx+d_i \geq 0 \end{aligned} \right.$
类似的问题还有
$\left \{ \begin{aligned} & minimize \quad & \sum \limits_{i=1}^{p} \frac{||F_ix+g_i||_2^2}{a_i^Tx+b_i} \\ & subject \quad & a_i^Tx+b_i \geq 0 \\ & \quad & c_i^Tx+d_i \geq 0 \end{aligned} \right.$

References

[1] https://zhuanlan.zhihu.com/p/133458743
[2] https://www.youtube.com/watch?v=dAyeNmz6p-c

expectmorata

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Convex optimization 3.1 --- 凸优化问题 part1

1 introduction在前面两个章节，回顾了凸集、凸函数、凸集和凸函数联系。从这章开始认识凸优化问题。2 凸优化问题2.1 优化问题的标准形式2.1.1 优化问题的最优解优化问题的最优解解集可能存在两种极端情况2.1.2 优化问题的解集可行解如果xix_ixi满足fi(x)、hi(x)f_i(x)、h_i(x)fi(x)、hi(x)，则称xix_ixi是可行解。最优解如果xix_ixi,使得f0(xi)=p∗f_0(x_i)=p*f0(xi)=p∗,则称x
复制链接

扫一扫