最优化方法(学习笔记)-第四章凸优化问题

凸优化问题

凸优化问题及其标准形式

optimization problem in standard form

标准形式介绍

目标函数: min ⁡ x f 0 ( x ) \min\limits_x f_0(x) xminf0(x)
满足条件: s u b j e c t t o ( s . t ) { f i ( x ) ≤ 0 , i = 1 , . . . , m h i ( x ) = 0 , i = 1 , . . . , p subject to(s.t)\begin{cases}f_i(x)\leq0,i=1,...,m \\ h_i(x)=0,i=1,...,p\end{cases} subjectto(s.t){fi(x)0,i=1,...,mhi(x)=0,i=1,...,p

含义/名称数学表达
变量decision var x ∈ R n x\isin R^n xRn
目标函数/损失函数lost function f 0 : R n    ⟹    R f_0:R^n\implies R f0:RnR
不等式约束函数inequality constraint function f i : R n    ⟹    R , i = 1 , . . . , m f_i:R^n\implies R,i=1,...,m fi:RnR,i=1,...,m
等式约束函数equality constraint function h i : R n    ⟹    R , i = 1 , . . . , p h_i:R^n\implies R,i=1,...,p hi:RnR,i=1,...,p
能取到的最小值(极限值)optimal value p ∗ = inf ⁡ x { f 0 ( x ) ∥ f i ( x ) ≤ 0 , h j ( x ) = 0 , i = 1 , . . . , m , j = 1 , . . . , p } p^*=\inf\limits_x\{f_0(x) \| f_i(x)\leq 0,h_j(x)=0,i=1,...,m,j=1,...,p\} p=xinf{f0(x)fi(x)0,hj(x)=0,i=1,...,m,j=1,...,p} 【如果问题无解则 p ∗ = ∞ p^*=\infty p=;问题无下界则 p ∗ = − ∞ p^*=-\infty p=

最优化的取值----局部极值,或者全局极值

定义1:非空集合里存在满足约束的元素x,且x属于 f 0 f_0 f0的定义域内( x ∈ d o m f 0 x\isin domf_0 xdomf0)。
定义2:非空集里的元素x使得 f 0 ( x ) = p ∗ ( 就 是 ∞ ) f_0(x)=p^*(就是\infty) f0(x)=p(),那么x就是目标函数的最优点。
定义3: X o p t 是 最 优 点 x 的 集 合 X_{opt}是最优点x的集合 Xoptx。(极值表现为某一段水平线)
定义4:如果存在 R > 0 R>0 R>0且满足 x 0 是 f 0 ( x ) x_0是f_0(x) x0f0(x)的最优点 ( s . t { f i ( x ) ≤ 0 , i = 1 , . . . , m h j ( x ) = 0 , j = 1 , . . . , p ∣ ∣ x − x 0 ∣ ∣ 2 ≤ R ) \begin{pmatrix}s.t \begin{cases}f_i(x)\leq0,i=1,...,m \\ h_j(x)=0,j=1,...,p \\ ||x-x_0||_2\leq R\end{cases}\end{pmatrix} s.tfi(x)0,i=1,...,mhj(x)=0,j=1,...,pxx02R,那么 x 0 x_0 x0就是局部最优点。(多个极值)

例子:
1. f 0 ( x ) = 1 x , d o m f 0 = R + + ( 正 半 轴 ) ; p ∗ = inf ⁡ x { f 0 ( x ) = 1 x ∣ x ∈ R + + } = 0 ; 极 限 值 是 0 , 但 取 不 到 x 的 准 确 值 , 所 以 没 有 最 优 点 f_0(x)=\frac{1}{x},domf_0=R_{++}(正半轴);p^*=\inf\limits_x\{ f_0(x)=\frac{1}{x} | x\isin R_{++}\}=0;极限值是0,但取不到x的准确值,所以没有最优点 f0(x)=x1domf0=R++p=xinf{f0(x)=x1xR++}=00x
2. f 0 ( x ) = − log ⁡ x , d o m f 0 = R + + ( 正 半 轴 ) ; p ∗ = − ∞ ; 问 题 答 案 无 下 界 , 没 有 最 优 点 f_0(x)=-\log{x},domf_0=R_{++}(正半轴);p^*=-\infty;问题答案无下界,没有最优点 f0(x)=logxdomf0=R++p=在这里插入图片描述
3. f 0 ( x ) = − x log ⁡ x , d o m f 0 = R + + ; ( f 0 ′ ( x ) 的 零 点 x = 1 e , f 0 ′ ′ ( x ) < 0 , f 0 ( 1 e ) 是 极 大 值 ) p ∗ = 1 e ; 最 优 点 就 是 x = 1 e f_0(x)=-x\log{x},domf_0=R_{++};(f_0'(x)的零点x=\frac{1}{e},f_0''(x)<0,f_0(\frac{1}{e})是极大值)p^*=\frac{1}{e};最优点就是x=\frac{1}{e} f0(x)=xlogx,domf0=R++f0(x)x=e1,f0(x)<0,f0(e1)p=e1x=e1
在这里插入图片描述
4. f 0 ( x ) = x 3 − 3 x , d o m f 0 = R ; p ∗ = − ∞ ; 但 是 存 在 局 部 最 小 值 x = 1 f_0(x)=x^3-3x,domf_0=R;p^*=-\infty;但是存在局部最小值x=1 f0(x)=x33x,domf0=Rp=x=1
在这里插入图片描述

标准形式中的隐式约束Implicit constraint

定义: x ∈ D = ⋂ i = 0 m d o m f i ∩ ⋂ i = 1 p d o m h i x\isin D=\bigcap\limits_{i=0}^{m}dom f_i\cap\bigcap\limits_{i=1}^p dom h_i xD=i=0mdomfii=1pdomhi
其中,D是问题的定义域, f i ( x ) ≤ 0 , h i ( x ) = 0 f_i(x)\leq 0,h_i(x)=0 fi(x)0,hi(x)=0是显式约束,没有显式约束(m=p=0)的问题就是无约束unconstrained问题。
例如:
min ⁡ f 0 ( x ) = − ∑ i = 1 k log ⁡ ( b i − a i T x ) , l o g 函 数 的 定 义 域 隐 性 要 求 a i T x < b i \min{f_0(x)}=-\sum_{i=1}^k \log{(b_i-a_i^Tx)},log函数的定义域隐性要求a_i^Tx<b_i minf0(x)=i=1klog(biaiTx)logaiTx<bi

可行域feasibility问题

含义:找满足显式条件的元素x,多个x构成一个集合。
定义:找 x , s . t { f i ( x ) ≤ 0 h i ( x ) = 0    ⟺    使 得 最 小 f 0 ( x ) = 0 , 满 足 { f i ( x ) ≤ 0 h i ( x ) = 0 x,s.t\begin{cases}f_i(x)\leq 0 \\ h_i(x)=0\end{cases}\iff 使得最小f_0(x)=0,满足\begin{cases}f_i(x)\leq 0 \\ h_i(x)=0\end{cases} xs.t{fi(x)0hi(x)=0使f0(x)=0,{fi(x)0hi(x)=0
其中,如果可行解存在,那么 p ∗ = 0 且 ∀ x 都 是 最 优 点 p^*=0且\forall x都是最优点 p=0x;如果可行解不存在,那么 p ∗ = ∞ p^*=\infty p=

凸优化问题

希望避免存在多个局部最优
定义: min ⁡ x f 0 ( x ) , s . t { f i ( x ) ≤ 0 , i = 1 , . . . , m h i ( x ) = 0 , i = 1 , . . . , p \min\limits_x f_0(x),s.t \begin{cases}f_i(x)\leq0,i=1,...,m \\ h_i(x)=0,i=1,...,p\end{cases} xminf0(x)s.t{fi(x)0,i=1,...,mhi(x)=0,i=1,...,p
其中
f i ( x ) 是 凸 函 数 c o n v e x , i = 0 , . . . , m f_i(x)是凸函数convex,i=0,...,m fi(x)convex,i=0,...,m h i ( x ) 是 仿 射 函 数 a f f i n e , i = 1 , . . . , p h_i(x)是仿射函数affine,i=1,...,p hi(x)仿affine,i=1,...,p;可行解集是凸集,该问题是凸优化问题。
f i ( x ) 是 凸 函 数 c o n v e x , i = 1 , . . . , m f_i(x)是凸函数convex,i=1,...,m fi(x)convex,i=1,...,m h i ( x ) 是 仿 射 函 数 a f f i n e , i = 1 , . . . , p h_i(x)是仿射函数affine,i=1,...,p hi(x)仿affine,i=1,...,p f 0 ( x ) 是 次 凸 函 数 f_0(x)是次凸函数 f0(x),该问题是次凸优化问题。

例子:转化为凸优化问题
min ⁡ f 0 ( x ) = x 1 2 + x 2 2 , s . t { f 1 ( x ) = x 1 1 + x 2 2 ≤ 0 h 1 ( x ) = ( x 1 + x 2 ) 2 = 0 \min f_0(x)=x_1^2+x_2^2,s.t \begin{cases} f_1(x)=\frac{x_1}{1+x_2^2}\leq 0 \\ h_1(x)=(x_1+x_2)^2=0\end{cases} minf0(x)=x12+x22,s.t{f1(x)=1+x22x10h1(x)=(x1+x2)2=0
易知:
1.二次函数 f 0 ( x ) f_0(x) f0(x)是凸函数    ⟹    \implies 可行解( x 1 = − x 2 x_1=-x_2 x1=x2)是凸集
2.但 f 1 ( x ) f_1(x) f1(x)不是凸函数, h 1 ( x ) h_1(x) h1(x)不是affine函数    ⟹    \implies 该问题不是凸优化问题
3.因为 f 1 ( x ) f_1(x) f1(x)的分母永远大于0,所以可以改写为: min ⁡ x 1 2 + x 2 2 ( s . t   x 1 ≤ 0 , x 1 + x 2 = 0 ) \min{x_1^2+x_2^2}(s.t\space x_1\leq 0,x_1+x_2=0) minx12+x22s.t x10,x1+x2=0。这样就可以满足凸优化问题的条件了。

局部最小值和全局最小值的问题

定理:凸优化问题的任意一个局部最优点就是全局最优点
证明:反证+局部最优的可行解定义+凸函数的基本性质
假设,x是局部最优值,但是y是全局最优,符合 f 0 ( y ) < f 0 ( x ) f_0(y)<f_0(x) f0(y)<f0(x)
根据局部最优,可行解z满足 f 0 ( x ) ≤ f 0 ( z ) , ∣ ∣ z − x ∣ ∣ 2 ≤ R f_0(x)\leq f_0(z),||z-x||_2\leq R f0(x)f0(z),zx2R
z = θ y + ( 1 − θ ) x , 且 ∣ ∣ z − x ∣ ∣ 2 = R 2 ≤ R z=\theta y+(1-\theta)x,且||z-x||_2=\frac{R}{2}\leq R z=θy+(1θ)x,zx2=2RR
代入z到等式中 ∣ ∣ θ ( y − x ) ∣ ∣ 2 = R 2    ⟹    θ = R 2 ∣ ∣ y − x ∣ ∣ 2 ||\theta(y-x)||_2=\frac{R}{2}\implies \theta=\frac{R}{2||y-x||_2} θ(yx)2=2Rθ=2yx2R
由凸函数的性质,得到 f 0 ( z ) = f 0 ( θ y + ( 1 − θ ) x ) ≤ θ f 0 ( y ) + ( 1 − θ ) f 0 ( x ) f_0(z)=f_0(\theta y+(1-\theta)x)\leq\theta f_0(y)+(1-\theta)f_0(x) f0(z)=f0(θy+(1θ)x)θf0(y)+(1θ)f0(x)
加上条件 f 0 ( y ) < f 0 ( x ) f_0(y)<f_0(x) f0(y)<f0(x),所以 f 0 ( z ) < θ f 0 ( x ) + ( 1 − θ ) f 0 ( x ) = f 0 ( x ) 【 与 可 行 解 定 义 矛 盾 】 f_0(z)<\theta f_0(x)+(1-\theta)f_0(x)=f_0(x)【与可行解定义矛盾】 f0(z)<θf0(x)+(1θ)f0(x)=f0(x)
综上,x是局部最优,就不存在其他的全局最优,也就是x是全局最优点。

可微函数的最优性条件

Optimality criterion for differentiable f 0 f_0 f0
定义: f 0 ( x ) 可 导 f_0(x)可导 f0(x)
x , y ∈ x,y\isin x,y可行解,且 ∀ y , 有 ▽ f 0 ( x ) T ( y − x ) ≥ 0    ⟺    x \forall y,有\triangledown f_0(x)^T(y-x)\geq 0\iff x y,f0(x)T(yx)0x是最优点
在这里插入图片描述
性质:
1.可行解集X是凸集
2. − ▽ f 0 ( x ) -\triangledown f_0(x) f0(x)是函数下降的方向,说明沿下降方向已无更优可行解
3. − ▽ f 0 ( x ) -\triangledown f_0(x) f0(x)定义出一个(垂直)的支撑面supporting hyperplane

无约束的优化问题

定义: x ∈ d o m f 0 , ▽ f 0 ( x ) = 0    ⟺    x x\isin dom f_0,\triangledown f_0(x)=0\iff x xdomf0,f0(x)=0x是最优点

等式约束的优化问题

[不知道是不是和拉格朗日对偶相关?]

定义:凸优化问题 min ⁡ f 0 ( x ) , s . t   A x = b \min{f_0(x)},s.t\space Ax=b minf0(x),s.t Ax=b
∃ μ , s . t   x ∈ d o m f 0 , A x = b , ▽ f 0 ( x ) = A T μ    ⟺    x \exist \mu,s.t\space x\isin domf_0,Ax=b,\triangledown f_0(x)=A^T\mu\iff x μ,s.t xdomf0,Ax=b,f0(x)=ATμx是最优点

证明:
根据可微函数最优点x的不等式性质 ▽ f 0 ( x ) T ( y − x ) ≥ 0 \triangledown f_0(x)^T(y-x)\geq 0 f0(x)T(yx)0
再构造一个 ▽ f 0 ( x ) T ( − ( y − x ) ) ≤ 0 \triangledown f_0(x)^T(-(y-x))\leq 0 f0(x)T((yx))0【这里的构造有点没懂,等之后补充】
使得等式 ▽ f 0 ( x ) T ( y − x ) = 0 \triangledown f_0(x)^T(y-x)=0 f0(x)T(yx)=0成立
于是说明 ▽ f 0 ( x ) T μ = ( A T μ ) T μ = μ T A μ = 0 \triangledown f_0(x)^T\mu=(A^T\mu)^T\mu=\mu^TA\mu=0 f0(x)Tμ=(ATμ)Tμ=μTAμ=0
【 设 μ = y − x , A = ( a 1 T a 2 T . . . a n T ) , A T 是 A 的 行 向 量 】 【设\mu=y-x,A=\begin{pmatrix} a_1^T\\ a_2^T \\ ... \\ a_n^T \end{pmatrix},A^T是A的行向量】 μ=yxA=a1Ta2T...anTATA
这个等式说明 ▽ f 0 ( x ) T ∈ { { a 1 , a 2 , . . . , a n } 的 张 成 空 间 } \triangledown f_0(x)^T\isin\{ \{a_1,a_2,...,a_n\}的张成空间\} f0(x)T{{a1,a2,...,an}}
▽ f 0 ( x ) = ∑ i μ i a i = A T μ , μ \triangledown f_0(x)=\sum\limits_i\mu_ia_i=A^T\mu,\mu f0(x)=iμiai=ATμμ与张成空间垂直。

特殊优化问题

非负象限的最小化minimization over nonnegative orthant
定义:凸优化问题 min ⁡ f 0 ( x ) , s . t { x ≥ 0 d o m f 0 = R + n \min{f_0(x)},s.t\begin{cases} x\geq0 \\ domf_0=R_+^n \end{cases} minf0(x),s.t{x0domf0=R+n
x ∈ d o m f 0 , x ≥ 0 , { ▽ T f 0 ( x ) i ≥ 0 x i = 0 ▽ T f 0 ( x ) i = 0 x i > 0    ⟺    x x\isin domf_0,x\geq 0,\begin{cases} \triangledown^Tf_0(x)_i\geq 0 & x_i=0 \\ \triangledown^Tf_0(x)_i=0&x_i>0 \end{cases}\iff x xdomf0,x0,{Tf0(x)i0Tf0(x)i=0xi=0xi>0x是最优点

证明:
根据可微函数最优点x的不等式性质 ▽ f 0 ( x ) T ( y − x ) ≥ 0 【 附 加 条 件 x ≥ 0 , ∀ y ≥ 0 】    ⟹    ▽ f 0 ( x ) T y ≥ ▽ f 0 ( x ) T x \triangledown f_0(x)^T(y-x)\geq 0【附加条件x\geq 0,\forall y\geq 0】\implies \triangledown f_0(x)^Ty\geq\triangledown f_0(x)^Tx f0(x)T(yx)0x0,y0f0(x)Tyf0(x)Tx
明显 ▽ f 0 ( x ) T x \triangledown f_0(x)^Tx f0(x)Tx是一个固定(最优点x)的值,设为 K K K

接下来讨论 ▽ f 0 ( x ) T y \triangledown f_0(x)^Ty f0(x)Ty的正负:
假设 ▽ f 0 ( x ) T y < 0 \triangledown f_0(x)^Ty<0 f0(x)Ty<0,存在一个特别大的 α > 0 \alpha>0 α>0,将这个负数乘积到最小,将会出现 α ∗ ▽ f 0 ( x ) T y < K ( 就 是 ▽ f 0 ( x ) T x ) \alpha*\triangledown f_0(x)^Ty<K(就是\triangledown f_0(x)^Tx) αf0(x)Ty<K(f0(x)Tx)的情况,这样就与不等式性质矛盾了,所以 ▽ f 0 ( x ) T y ≥ 0 ( ∀ y ≥ 0 ) \triangledown f_0(x)^Ty\geq 0(\forall y\geq 0) f0(x)Ty0(y0)

接下来讨论 y y y的取值:
假设 y > 0 y>0 y>0,那么 ▽ f 0 ( x ) T y ≥ 0    ⟹    ▽ f 0 ( x ) T ≥ 0 \triangledown f_0(x)^Ty\geq 0\implies \triangledown f_0(x)^T\geq 0 f0(x)Ty0f0(x)T0
假设 y = 0 y=0 y=0,那么 ▽ f 0 ( x ) T y = 0 ≥ ▽ f 0 ( x ) T x 【 x ≥ 0 】 \triangledown f_0(x)^Ty=0\geq \triangledown f_0(x)^Tx【x\geq 0】 f0(x)Ty=0f0(x)Txx0

⇒ 为 了 寻 找 临 界 − K K T 附 加 条 件 ▽ f 0 ( x ) T x = 0    ⟺    { ▽ T f 0 ( x ) i ≥ 0 x i = 0 ▽ T f 0 ( x ) i = 0 x i > 0 \xRightarrow{为了寻找临界-KKT附加条件} \triangledown f_0(x)^Tx=0\iff\begin{cases} \triangledown^Tf_0(x)_i\geq 0 & x_i=0 \\ \triangledown^Tf_0(x)_i=0&x_i>0 \end{cases} KKT f0(x)Tx=0{Tf0(x)i0Tf0(x)i=0xi=0xi>0

等价凸优化问题

两个问题A和B的解,A的解可以从B的解中立即得到,且B的解也可以从A的解立即得到,那么两个问题A和B就等价。

消除等式约束

定义:凸优化问题 A    ⟺    B A\iff B AB
min ⁡ f 0 ( x ) , s . t { f i ( x ) ≤ 0 , i = 1 , . . . , m A x = b ( 准 备 被 消 除 的 部 分 ) \min{f_0(x)},s.t\begin{cases} f_i(x)\leq 0,i=1,...,m \\ Ax=b(准备被消除的部分) \end{cases} minf0(x),s.t{fi(x)0,i=1,...,mAx=b()
⇔ x = F z + x 0 min ⁡ f 0 ( F z + x 0 ) , s . t   f i ( F z + x 0 ) ≤ 0 , i = 1 , . . . , m \xLeftrightarrow{x=Fz+x_0}\min{f_0(Fz+x_0)},s.t\space f_i(Fz+x_0)\leq 0,i=1,...,m x=Fz+x0 minf0(Fz+x0),s.t fi(Fz+x0)0,i=1,...,m

证明:
容易搜索得到 A x = b Ax=b Ax=b的一个特解 A x 0 = b Ax_0=b Ax0=b
再假设出齐次方程组的解(零空间) A v = 0 , F = { v 1 , v 2 , . . . , v k } Av=0,F=\{v_1,v_2,...,v_k\} Av=0,F={v1,v2,...,vk}
根据非齐次方程组的解,可以假设存在系数 z = { z 1 , z 2 , . . . , z k } z=\{z_1,z_2,...,z_k\} z={z1,z2,...,zk},使得 x = ∑ i = 1 k v i z i + x 0 = F z + x 0 x=\sum\limits_{i=1}^kv_iz_i+x_0=Fz+x_0 x=i=1kvizi+x0=Fz+x0是原方程的一种解(变成仿射函数的形式)
于是只要替换掉 x x x,就可以保证 A x = b Ax=b Ax=b成立。

引入等式约束

定义:凸优化问题 A    ⟺    B A\iff B AB
min ⁡ f 0 ( A 0 x + b 0 ) , s . t   f i ( A i x + b i ) ≤ 0 , i = 1 , . . . , m \min{f_0(A_0x+b_0)},s.t\space f_i(A_ix+b_i)\leq 0,i=1,...,m minf0(A0x+b0),s.t fi(Aix+bi)0,i=1,...,m
⇔ y i = A i x + b i min ⁡ f 0 ( y 0 ) , s . t { f i ( y i ) ≤ 0 , i = 1 , . . . , m y i = A i x + b i , i = 0 , 1 , . . . , m \xLeftrightarrow{y_i=A_ix+b_i}\min{f_0(y_0)},s.t\begin{cases} f_i(y_i)\leq 0,i=1,...,m \\ y_i=A_ix+b_i,i=0,1,...,m \end{cases} yi=Aix+bi minf0(y0),s.t{fi(yi)0,i=1,...,myi=Aix+bi,i=0,1,...,m

不等式约束变成等式约束

引入一个松弛因子 y 0 = A 0 x + b 0 y_0=A_0x+b_0 y0=A0x+b0和m个哑变量 s i s_i si(slack variables)

定义:凸优化问题 A    ⟺    B A\iff B AB
min ⁡ f 0 ( x ) , s . t   a i T x ≤ b i , i = 1 , . . . , m \min{f_0(x)},s.t\space a_i^Tx\leq b_i,i=1,...,m minf0(x),s.t aiTxbi,i=1,...,m
⇔ 引 入 s i min ⁡ f 0 ( x ) , s . t { a i T x + s i = b i , i = 1 , . . . , m s i ≥ 0 , i = 1 , . . . , m \xLeftrightarrow{引入s_i}\min{f_0(x)},s.t\begin{cases} a_i^Tx+s_i=b_i,i=1,...,m \\ s_i\geq 0,i=1,...,m \end{cases} si minf0(x),s.t{aiTx+si=bi,i=1,...,msi0,i=1,...,m

上凸形式epigraph

定义:凸优化问题的epigraph形式
求 f 0 最 小 值 , 变 成 求 t 最 小 值 : { ( f 0 ( x ) , t ) ∣ f 0 ( x ) < t } 求f_0最小值,变成求t最小值:\{(f_0(x),t)|f_0(x)<t\} f0t{(f0(x),t)f0(x)<t}
min ⁡ ( x , t ) t , s . t { f 0 ( x ) − t ≤ 0 ( 凸 函 数 ) f i ( x ) ≤ 0 , i = 1 , . . . , m A x = b \min\limits_{(x,t)}{t},s.t\begin{cases} f_0(x)-t\leq 0(凸函数) \\ f_i(x)\leq 0,i=1,...,m \\ Ax=b \end{cases} (x,t)mint,s.tf0(x)t0()fi(x)0,i=1,...,mAx=b

最小化一些无关变量

在处理有约束变量之前,将无约束(不影响最小化结果)变量先最优化(两个变量的例子如下)
定义:凸优化问题 A    ⟺    B A\iff B AB
min ⁡ f 0 ( x 1 , x 2 ) , s . t   f i ( x 1 ) ≤ 0 , i = 1 , . . . , m \min{f_0(x_1,x_2)},s.t\space f_i(x_1)\leq 0,i=1,...,m minf0(x1,x2),s.t fi(x1)0,i=1,...,m
⇔ 处 理 掉 x 2 【 f 0 ~ ( x 1 ) = inf ⁡ x 2 f 0 ( x 1 , x 2 ) 】 \xLeftrightarrow{处理掉x_2【\widetilde{f_0}(x_1)=\inf\limits_{x_2}f_0(x_1,x_2)】} x2f0 (x1)=x2inff0(x1,x2)
min ⁡ f 0 ~ ( x 1 ) , s . t   f i ( x 1 ) ≤ 0 , i = 1 , . . . , m \min{\widetilde{f_0}(x_1)},s.t\space f_i(x_1)\leq 0,i=1,...,m minf0 (x1),s.t fi(x1)0,i=1,...,m

次凸优化问题quasiconvex optimization

次凸函数

定义:次凸函数的定义域和水平集都是凸集,只有一个最小的极小值,可以有多个局部极值,满足 S α = { x ∈ d o m f ∣ f ( x ) ≤ α } S_\alpha=\{x\isin domf|f(x)\leq \alpha\} Sα={xdomff(x)α},该函数的水平集要求是连续的区间都符合这个要求,不存在某个水平线将函数分割为多个局部极小值。
在这里插入图片描述

  • 不等式性质: f ( θ x + ( 1 − θ ) y ) ≤ m a x { f ( x ) , f ( y ) } f(\theta x+(1-\theta)y)\leq max\{f(x),f(y)\} f(θx+(1θ)y)max{f(x),f(y)}
  • 必要条件:保证转折处/拐点不会出现先增后减的图形,要求 ∀ x ∈ d o m f , ∀ y ∈ R n ( y ≠ 0 ) , f ( x ) 是 极 小 值 \forall x\isin domf,\forall y\isin R^n(y\neq0),f(x)是极小值 xdomf,yRn(y=0),f(x)
    • 一阶条件: f ( y ) ≤ f ( x )    ⟹    ▽ f ( x ) T ( y − x ) ≤ 0 f(y)\leq f(x)\implies\triangledown f(x)^T(y-x)\leq 0 f(y)f(x)f(x)T(yx)0
    • 二阶条件: y T ▽ f ( x ) = 0    ⟹    y T ▽ 2 f ( x ) y ≥ 0 y^T\triangledown f(x)=0\implies y^T\triangledown^2f(x)y\geq 0 yTf(x)=0yT2f(x)y0
      从一维实数集看,就是 f ′ ( x ) = 0    ⟹    f ′ ′ ( x ) ≥ 0 f'(x)=0\implies f''(x)\geq 0 f(x)=0f(x)0
  • 充分条件: y T ▽ f ( x ) = 0    ⟹    y T ▽ 2 f ( x ) y > 0 y^T\triangledown f(x)=0\implies y^T\triangledown^2f(x)y>0 yTf(x)=0yT2f(x)y>0

次凸函数的标准化定义 次 凸 函 数 f 0 ( x ) , m 个 凸 函 数 f i ( x ) 次凸函数f_0(x),m个凸函数f_i(x) f0(x),mfi(x)
min ⁡ f 0 ( x ) , s . t { f i ( x ) ≤ 0 , i = 1 , . . . , m A x = b \min{f_0(x)},s.t\begin{cases} f_i(x)\leq 0,i=1,...,m \\ Ax=b \end{cases} minf0(x),s.t{fi(x)0,i=1,...,mAx=b

次凸函数向凸函数的转化

convex representation of sublevel sets of f 0 f_0 f0
对 于 一 个 次 凸 函 数 f 0 , 转 化 为 一 系 列 的 多 个 凸 函 数 ϕ t ( x ) , ∀ t 使 得 对 于 x 来 说 , f 0 ( x ) ≤ t    ⟺    ϕ t ( x ) ≤ 0 对于一个次凸函数f_0,转化为一系列的多个凸函数\phi_t(x),\forall t使得对于x来说,f_0(x)\leq t\iff \phi_t(x)\leq0 f0ϕt(x)t使xf0(x)tϕt(x)0
比如: ϕ ( x ) = { 0 f ( x ) ≤ t ∞ f ( x ) > t \phi(x)=\begin{cases} 0&f(x)\leq t\\ \infty& f(x)>t \end{cases} ϕ(x)={0f(x)tf(x)>t
在这里插入图片描述
举例:
f 0 ( x ) = p ( x ) q ( x ) , ∀ x ∈ d o m f f_0(x)=\frac{p(x)}{q(x)},\forall x\isin domf f0(x)=q(x)p(x)xdomf
凸 函 数 p ( x ) ≥ 0 ( 且 p ′ ′ ( x ) > 0 ) , 凹 函 数 q ( x ) > 0 ( 且 q ′ ′ ≤ 0 ) 凸函数p(x)\geq 0(且p''(x)>0),凹函数q(x)>0(且q''\leq 0) p(x)0p(x)>0,q(x)>0q0
先验证 f 0 ( x ) f_0(x) f0(x)是次凸函数
令 f 0 ′ ( x ) = p ′ q − p q ′ q 2 = 0 , 有 f 0 ′ ′ ( x ) = ( p ′ ′ q − p q ′ ′ ) q 2 − 2 q q ′ ( p ′ q − p q ′ ) q 4 = p ′ ′ q − p q ′ ′ q 2 > 0 , 令f'_0(x)=\frac{p'q-pq'}{q^2}=0,有f''_0(x)=\frac{(p''q-pq'')q^2-2qq'(p'q-pq')}{q^4}=\frac{p''q-pq''}{q^2}>0, f0(x)=q2pqpq=0f0(x)=q4(pqpq)q22qq(pqpq)=q2pqpq>0所以根据充分条件可知, f 0 ( x ) f_0(x) f0(x)是次凸函数
   ⟹    \implies 次凸函数的水平集 f 0 ( x ) ≤ t    ⟺    p ( x ) ≤ t q ( x ) f_0(x)\leq t\iff p(x)\leq tq(x) f0(x)tp(x)tq(x)
   ⟹    \implies ϕ t ( x ) = p ( x ) − t q ( x ) , 发 现 是 凸 函 数 , 于 是 化 为 求 解 ϕ t ( x ) ≤ 0 \phi_t(x)=p(x)-tq(x),发现是凸函数,于是化为求解\phi_t(x)\leq 0 ϕt(x)=p(x)tq(x)ϕt(x)0

通过解可行域进行次凸优化(二分法求解极小值)

次凸问题转化为一个可行域问题(1):
f i n d   x , s . t { ϕ t ( x ) ≤ 0 f i ( x ) ≤ 0 , i = 1 , . . . , m A x = b   ( 1 ) find\space x,s.t\begin{cases}\phi_t(x)\leq 0 \\ f_i(x)\leq 0,i=1,...,m \\ Ax=b \end{cases}\space(1) find x,s.tϕt(x)0fi(x)0,i=1,...,mAx=b (1)
存在 f 0 f_0 f0的最小值 p ∗ p^* p

  • 若该问题有可行域,那么 p ∗ ≤ t p^*\leq t pt;否则 p ∗ > t p^*> t p>t
  • 采用二分法求解 p ∗ p^* p,复杂度是 l o g 2 ( ( u − l ) / ε ) log_2((u-l)/\varepsilon) log2((ul)/ε)
    • 假设 l ≤ p ∗ , u ≥ p ∗ , 允 许 误 差 ε l\leq p^*,u\geq p^*,允许误差\varepsilon lp,up,ε
    • 迭代 { 1. t = u + l 2 2. 求 解 可 行 域 问 题 ( 1 ) 3. { 如 果 有 解 , 减 小 上 界 u = u + l 2 如 果 无 解 , 增 大 上 界 l = u + l 2 直 到 间 隔 小 于 等 于 误 差 u − l ≤ ε \begin{cases}1.t=\frac{u+l}{2} \\2.求解可行域问题(1) \\ 3.\begin{cases}如果有解,减小上界u=\frac{u+l}{2} \\ 如果无解,增大上界l=\frac{u+l}{2}\end{cases} \\ 直到间隔小于等于误差u-l\leq\varepsilon\end{cases} 1.t=2u+l2.(1)3.{,u=2u+l,l=2u+lulε

线性优化linear optimization

线性规划linear program(LP)

定义:凸优化问题 min ⁡ c T x + d , s . t { G x ≤ h A x = b G 是 行 满 秩 [ m = n 时 是 唯 一 解 ] \min{c^Tx+d},s.t\begin{cases} Gx\leq h \\ Ax=b \end{cases}\quad G是行满秩[m=n时是唯一解] mincTx+d,s.t{GxhAx=bG[m=n]
可行域是一个多面体,优化目标是一个等值面,沿梯度下降的方向移动,直到遇到临界边角.
在这里插入图片描述
举例:购买营养丰富的食物代价最小化
c j 表 示 食 物 j 的 代 价 , x j 表 示 食 物 j 的 数 量 , a i j 表 示 食 物 j 的 第 i 类 营 养 的 含 量 , b i 是 各 类 营 养 的 要 求 c_j表示食物j的代价,x_j表示食物j的数量,a_{ij}表示食物j的第i类营养的含量,b_{i}是各类营养的要求 cjj,xjj,aijji,bi
min ⁡ c T x , s . t { x ≥ 0 A x ≥ b \min{c^Tx},s.t\begin{cases} x\geq 0 \\ Ax\geq b \end{cases} mincTx,s.t{x0Axb

线性分片最小化( m i n , m a x    ⟹    m i n ) min,max\implies min) min,maxmin)

定义:凸优化问题 m i n max ⁡ i = 1 , . . . , m a i T x + b i min\max_{i=1,...,m}{a_i^Tx+b_i} minmaxi=1,...,maiTx+bi
   ⟺    \iff min ⁡ t , s . t   a i T x + b i ≤ t , i = 1 , . . . , m \min{t},s.t\space a_i^Tx+b_i\leq t,i=1,...,m mint,s.t aiTx+bit,i=1,...,m
举例:多面体的切比雪夫中心内置球的最大化
r表示内置球的半径 , a i 表 示 各 个 方 向 , x c 表 示 切 比 雪 夫 中 心 坐 标 ,a_i表示各个方向,x_c表示切比雪夫中心坐标 ,ai,xc
max ⁡ r , s . t   a i T x c + r ∣ ∣ a i ∣ ∣ 2 ≤ b i , i = 1 , . . . , m \max{r},s.t\space a_i^Tx_c+r||a_i||_2\leq b_i,i=1,...,m maxr,s.t aiTxc+rai2bi,i=1,...,m
在这里插入图片描述

线性分式规划Linear-fractional program

定义:次凸优化问题 min ⁡ f 0 ( x ) = c T x + d e T x + f , s . t { G x ≤ h A x = b , d o m f 0 ( x ) = { x ∣ e T x + f > 0 } \min{f_0(x)=\frac{c^Tx+d}{e^Tx+f}},s.t\begin{cases} Gx\leq h \\ Ax=b \end{cases},domf_0(x)=\{x|e^Tx+f>0\} minf0(x)=eTx+fcTx+d,s.t{GxhAx=b,domf0(x)={xeTx+f>0}
可以通过变量替换变成次凸问题的形式 y = x e T x + f , z = 1 e T x + f , x = y z y=\frac{x}{e^Tx+f},z=\frac{1}{e^Tx+f},x=\frac{y}{z} y=eTx+fx,z=eTx+f1,x=zy
min ⁡ c T y + d z , s . t { G y ≤ h z A y = b z e T y + f z = 1 z ≥ 0 \min c^Ty+dz,s.t\begin{cases} Gy\leq hz \\ Ay=bz \\ e^Ty+fz=1 \\ z\geq 0 \end{cases} mincTy+dz,s.tGyhzAy=bzeTy+fz=1z0
然后通过二分法求解极小值 p ∗ p^* p

扩展线性分式规划generalized L-F

定义:次凸优化问题 f 0 ( x ) = max ⁡ i = 1 , . . . , r c i T x + d i e i T x + f i , d o m f 0 ( x ) = { x ∣ e i T x + f i > 0 , i = 1 , . . . , r } {f_0(x)=\max\limits_{i=1,...,r}{\frac{c_i^Tx+d_i}{e_i^Tx+f_i}}},domf_0(x)=\{x|e_i^Tx+f_i>0,i=1,...,r\} f0(x)=i=1,...,rmaxeiTx+ficiTx+di,domf0(x)={xeiTx+fi>0,i=1,...,r},可以通过二分法求解
例子:稳健成长经济的冯诺依曼模型Von Neumann model

  • 当 前 的 活 动 x , 下 一 刻 活 动 x + ∈ R n , 消 耗 量 ( B x ) i , 产 出 ( A x ) i , 第 i 部 分 的 成 长 率 x i + x i 当前的活动x,下一刻活动x^+\isin R^n,消耗量(Bx)_i,产出(Ax)_i,第i部分的成长率\frac{x_i^+}{x_i} x,x+Rn,(Bx)i,(Ax)i,ixixi+
  • max ⁡ x , x + min ⁡ i = 1 , . . . , n x i + x i , s . t { x + ≥ 0 B x + ≤ A x \max\limits_{x,x^+}\min\limits_{i=1,...,n}\frac{x_i^+}{x_i},s.t \begin{cases}x^+\geq 0 \\ Bx^+\leq Ax\end{cases} x,x+maxi=1,...,nminxixi+,s.t{x+0Bx+Ax
  • 求解方式:(可以对分式引入哑变量t)利用线性分片最小化(切比雪夫逼近)处理max,min(保凸运算)
    min ⁡ x , x + max ⁡ i = 1 , . . . , n − x i + x i , s . t { x + ≥ 0 B x + ≤ A x \min\limits_{x,x^+}\max\limits_{i=1,...,n}-\frac{x_i^+}{x_i},s.t \begin{cases}x^+\geq 0 \\ Bx^+\leq Ax\end{cases} x,x+mini=1,...,nmaxxixi+,s.t{x+0Bx+Ax
    • bisection【二分法】
      ∀ t < 0 , max ⁡ i = 1 , . . . , n − x i + x i ≤ 0    ⟹    ϕ t ( x + , x ) = − t x − x + ≤ 0 \forall t<0,\max\limits_{i=1,...,n}-\frac{x_i^+}{x_i}\leq 0\implies\phi_t(x^+,x)=-tx-x^+\leq0 t<0,i=1,...,nmaxxixi+0ϕt(x+,x)=txx+0
      f i n d   ( x + , x ) , s . t { ϕ t ( x + , x ) ≤ 0 x > 0 x + > 0 B x + < A x find\space (x^+,x),s.t\begin{cases}\phi_t(x^+,x)\leq 0 \\ x>0 \\x^+>0 \\ Bx^+<Ax \end{cases} find (x+,x),s.tϕt(x+,x)0x>0x+>0Bx+<Ax
    • Piecewise-linear mininzation【线性分片最小化】
      min ⁡ ( x + , x , t ) t , s . t { − x i + x i ≤ t , i = 1 , . . . , m x > 0 x + > 0 B x + ≤ A x \min\limits_{(x^+,x,t)}t,s.t\begin{cases}-\frac{x_i^+}{x_i}\leq t,i=1,...,m \\ x>0\\x^+>0 \\ Bx^+\leq Ax \end{cases} (x+,x,t)mint,s.txixi+t,i=1,...,mx>0x+>0Bx+Ax

线性规划是否有解的情况

  • 可行域是空集:无解/不可行
  • 可行域无界:无最优解,但可行解
  • 可行域有界:有最优解
    • 最优解唯一,顶点存在且是最优解
    • 最优解不唯一,顶点依然是最优解

二次规划Quadratic program(QP)

普通二次规划

定义:二次凸优化函数 min ⁡ 1 2 x T P x + q T x + r , s . t { G x ≤ h A x = b P ∈ S + n ( 半 正 定 的 对 称 矩 阵 ) \min{\frac{1}{2}x^TPx+q^Tx+r},s.t\begin{cases}Gx\leq h \\ Ax=b \\ P\isin S_+^n(半正定的对称矩阵)\end{cases} min21xTPx+qTx+r,s.tGxhAx=bPS+n()
目标函数是二次函数,所以是曲线形式(等值线),然后沿着负梯度方向(与等值线垂直),找到可行域的临界(最优解不一定在顶点)
在这里插入图片描述
接下来介绍两个样例:

多面体间的最小距离

定义:二次凸函数 A    ⟺    B A\iff B AB
P 1 = { x ∣ A 1 x < b 1 } , P 2 = { x ∣ A 2 x < b 2 } P_1=\{x|A_1x<b_1\},P_2=\{x|A_2x<b_2\} P1={xA1x<b1},P2={xA2x<b2}
d i s t ( P 1 , P 2 ) = inf ⁡ { ∣ ∣ x 1 − x 2 ∣ ∣ 2 ∣ ∣ x 1 ∈ P 1 , x 2 ∈ P 2 }    ⟺    min ⁡ ∣ ∣ x 1 − x 2 ∣ ∣ 2 2 , s . t { A 1 x 1 ≤ b 1 A 2 x 2 ≤ b 2 dist(P_1,P_2)=\inf\{||x_1-x_2||_2||x_1\isin P_1,x_2\isin P_2\}\iff\min{||x_1-x_2||_2^2},s.t\begin{cases} A_1x_1\leq b_1 \\ A_2x_2\leq b_2\end{cases} dist(P1,P2)=inf{x1x22x1P1,x2P2}minx1x222,s.t{A1x1b1A2x2b2
关于最小值:

  • 两个多面体之间有交集时,肯定有最小点对
  • 多面体没有交集时,最小点对不一定唯一,但多面体间距离最小值是唯一的

带噪音的线性规划

定义:二次凸函数 min ⁡ c ˉ T x + γ x T ∑ x = E ( c T x ) + γ v a r ( c T x ) , s . t { G x ≤ h A x = b \min{\bar{c}^Tx+\gamma x^T\sum x=E(c^Tx)+\gamma var(c^Tx)},s.t\begin{cases} Gx\leq h \\ Ax=b\end{cases} mincˉTx+γxTx=E(cTx)+γvar(cTx),s.t{GxhAx=b
【噪音】
随机代价/变量 c c c 均 值 E ( c ) = c ˉ , 方 差 v a r ( c ) = E [ ( c − c ˉ ) 2 ] = ∑ 均值E(c)=\bar{c},方差var(c)=E[(c-\bar{c})^2]=\sum E(c)=cˉvar(c)=E[(ccˉ)2]=
【个人理解】
假设是投资问题,那么x就是本金,c就是带风险的回报率, γ \gamma γ指投资人的风险承受力
均 值 E ( c T x ) = c ˉ T x , 方 差 v a r ( c T x ) = E [ ( c T x − E ( c T x ) ) 2 ] = x T ∑ x 均值E(c^Tx)=\bar{c}^Tx,方差var(c^Tx)=E[(c^Tx-E(c^Tx))^2]=x^T\sum x E(cTx)=cˉTxvar(cTx)=E[(cTxE(cTx))2]=xTx

最小二乘法

定义:二次凸函数 min ⁡ ∣ ∣ A x − b ∣ ∣ 2 2 , s . t l ≤ x ≤ μ \min{||Ax-b||_2^2},s.t\quad l\leq x\leq \mu minAxb22,s.tlxμ
当没有限制条件下,有解析解 x = ( A T A ) − 1 A b x=(A^TA)^{-1}Ab x=(ATA)1Ab

二次约束的二次规划quadratically constrained quadratic program(QCQP)

就是二次规划问题的一次线性不等式约束,变成二次的非线性不等式约束
定义:二次凸问题 min ⁡ 1 2 x T P 0 x + q 0 T x + r 0 , s . t { 1 2 x T P i x + q i T x + r i ≤ 0 , i = 1 , . . . , m A x = b P i ∈ S + n ( 半 正 定 的 对 称 矩 阵 ) \min{\frac{1}{2}x^TP_0x+q_0^Tx+r_0},s.t\begin{cases} \frac{1}{2}x^TP_ix+q_i^Tx+r_i\leq 0,i=1,...,m\\ Ax=b \\P_i\isin S_+^n(半正定的对称矩阵)\end{cases} min21xTP0x+q0Tx+r0,s.t21xTPix+qiTx+ri0,i=1,...,mAx=bPiS+n()
特别的: P i ∈ S + + n ( 正 定 对 称 矩 阵 ) , 可 行 域 将 在 m 个 椭 圆 域 的 交 集 里 P_i\isin S_{++}^n(正定对称矩阵),可行域将在m个椭圆域的交集里 PiS++n(),m

二阶锥约束的线性规划Second-order cone programming(SOCP)

二次非线性的不等式条件属于二阶锥域
定义:一次凸问题 min ⁡ f T x , s . t { ∣ ∣ A i x + b i ∣ ∣ 2 ≤ c i T x + d i , i = 1 , . . . , m F x = g \min{f^Tx},s.t\begin{cases}||A_ix+b_i||_2\leq c_i^Tx+d_i,i=1,...,m\\ Fx=g \end{cases} minfTx,s.t{Aix+bi2ciTx+di,i=1,...,mFx=g

  • 隐性限制 { A i ∈ R n i × n , A i 可 以 理 解 为 测 量 矩 阵 , 输 入 的 是 观 测 值 的 线 性 组 合 F ∈ R P × n , A i 和 F 都 可 以 是 非 方 阵 ( A i x + b i , c i T x + d i ) ∈ R n i + 1 ( 二 阶 锥 内 ) \begin{cases}A_i\isin R^{n_i\times n},A_i可以理解为测量矩阵,输入的是观测值的线性组合\\F\isin R^{P\times n},A_i和F都可以是非方阵\\(A_ix+b_i,c_i^Tx+d_i)\isin R^{n_i+1}(二阶锥内)\end{cases} AiRni×n,Ai线FRP×n,AiF(Aix+bi,ciTx+di)Rni+1()

  • SOC是二阶锥的限制,要求 ∣ ∣ f ( x ) ( x , t ) ∣ ∣ 2 ≤ t , s . t ∣ ∣ x ∣ ∣ 2 < t ||f(x)_{(x,t)}||_2\leq t,s.t\quad ||x||_2<t f(x)(x,t)2ts.tx2<t

  • A i = 0    ⟹    c i T x + d i ≥ b i A_i=0\implies c_i^Tx+d_i\geq b_i Ai=0ciTx+dibi,就变成了LP问题

  • c i = 0    ⟹    ∣ ∣ A i x + b i ∣ ∣ 2 ≤ d i    ⟹    ∣ ∣ A i x + b i ∣ ∣ 2 2 ≤ d i 2 c_i=0\implies ||A_ix+b_i||_2\leq d_i\implies||A_ix+b_i||_2^2\leq d_i^2 ci=0Aix+bi2diAix+bi22di2,就变成了QCQP问题
    原式 = ( A i x + b i ) T ( A i x + b i ) − d i 2 =(A_ix+b_i)^T(A_ix+b_i)-d_i^2 =(Aix+bi)T(Aix+bi)di2
    = x T A i T A i x + 2 b i A i x + b i 2 − d i 2 ( A i T A i ∈ S + n ) =x^TA_i^TA_ix+2b_iA_ix+b_i^2-d_i^2(A_i^TA_i\isin S_+^n) =xTAiTAix+2biAix+bi2di2AiTAiS+n

  • 思考: 当 c i ≠ 0 时 , 为 什 么 不 是 Q C Q P 问 题 ? 当c_i\neq0时,为什么不是QCQP问题? ci=0QCQP
    因为存在隐性的线性不等式要求
    ∣ ∣ A i x + b i ∣ ∣ 2 ≤ c i T + d i    ⟺    { ∣ ∣ A i x + b i ∣ ∣ 2 2 ≤ ( c i T x + d i ) 2 c i T x + d i ≥ 0 ||A_ix+b_i||_2\leq c_i^T+d_i\iff\begin{cases}||A_ix+b_i||_2^2\leq(c_i^Tx+d_i)^2 \\ c_i^Tx+d_i\geq 0\end{cases} Aix+bi2ciT+di{Aix+bi22(ciTx+di)2ciTx+di0

  • 所以SOCP问题相对LP问题和QCQP问题更一般

稳健的线性规划Robust linear programming(RLP)(带随机变量)

以下讨论的优化问题中存在随机变量,即不确定性的参数 c , a i , b i c,a_i,b_i c,ai,bi
定义:凸优化问题 min ⁡ c T x , s . t a i T x ≤ b i , i = 1 , . . . , m \min{c^Tx},s.t\quad a_i^Tx\leq b_i,i=1,...,m mincTxs.taiTxbi,i=1,...,m
接下来针对不确定性参数 a i a_i ai进行处理,有以下两种方案。

利用确定约束转化为SOCP问题–deterministic approach

利用确定性的模型,强制要求所有点都符合参数的限制 a i ∈ ε i a_i\isin\varepsilon_i aiεi
定义:凸优化问题 min ⁡ c T x , s . t a i T x ≤ b i , ∀ a i ∈ ε i , i = 1 , . . . , m \min{c^Tx},s.t\quad a_i^Tx\leq b_i,\forall a_i\isin\varepsilon_i,i=1,...,m mincTx,s.taiTxbi,aiεi,i=1,...,m

  • 设置椭球ellipsoid的限制 ε i = { a i ˉ + P i μ ∣   ∣ ∣ u ∣ ∣ 2 ≤ 1 } ( a i ˉ ∈ R n , P i ∈ R n × n ) \varepsilon_i=\{\bar{a_i}+P_i\mu|\space||u||_2\leq1\}(\bar{a_i}\isin R^n,P_i\isin R^{n\times n}) εi={aiˉ+Piμ u21}(aiˉRn,PiRn×n)
    sup ⁡ a i ∈ ε i ( a i T x ) = sup ⁡ ∣ ∣ μ ∣ ∣ 2 ≤ 1 ( a i ˉ T x + ( P i μ ) T x ) = a i ˉ T x + sup ⁡ ∣ ∣ μ ∣ ∣ 2 ≤ 1 ( ( P i μ ) T x ) \sup\limits_{a_i\isin \varepsilon_i}{(a_i^Tx)}=\sup\limits_{||\mu||_2\leq1}{(\bar{a_i}^Tx+(P_i\mu)^Tx)}=\bar{a_i}^Tx+\sup\limits_{||\mu||_2\leq1}{((P_i\mu)^Tx)} aiεisup(aiTx)=μ21sup(aiˉTx+(Piμ)Tx)=aiˉTx+μ21sup((Piμ)Tx)
    = μ 最 大 是 1 a i ˉ T x + ∣ ∣ P i T x ∣ ∣ 2 ∣ ∣ μ ∣ ∣ 2 = a i ˉ T x + ∣ ∣ P i T x ∣ ∣ 2 \xlongequal{\mu最大是1}\bar{a_i}^Tx+||P_i^Tx||_2||\mu||_2=\bar{a_i}^Tx+||P_i^Tx||_2 μ1 aiˉTx+PiTx2μ2=aiˉTx+PiTx2
  • 代入线性不等式: a i ˉ T x + ∣ ∣ P i T x ∣ ∣ 2 ≤ b i , i = 1 , . . . , m \bar{a_i}^Tx+||P_i^Tx||_2\leq b_i,i=1,...,m aiˉTx+PiTx2bi,i=1,...,m
  • 所以转变为求解SOCP问题 min ⁡ c T x , s . t ∣ ∣ P i T x ∣ ∣ 2 ≤ − a i ˉ T x + b i , i = 1 , . . . , m \min{c^Tx},s.t\quad||P_i^Tx||_2\leq -\bar{a_i}^Tx+b_i,i=1,...,m mincTx,s.tPiTx2aiˉTx+bi,i=1,...,m

利用概率转化为SOCP问题–stochastic approach

要求有一定量的点符合线性不等式条件
定义:凸优化问题 min ⁡ c T x , s . t p r o b ( a i T x ≤ b i ) ≥ η , i = 1 , . . . , m \min{c^Tx},s.t\quad prob(a_i^Tx\leq b_i)\geq\eta,i=1,...,m mincTx,s.tprob(aiTxbi)η,i=1,...,m

  • 假设部分参数符合高斯分布: a i ∽ N ( a i ˉ , ∑ i ) , a i T x ∽ N ( a i ˉ T x , x T ∑ i x ) a_i\backsim N(\bar{a_i},\sum_i),a_i^Tx\backsim N(\bar{a_i}^Tx,x^T\sum_ix) aiN(aiˉ,i)aiTxN(aiˉTx,xTix)
  • 标准化不等式: P ( a i T x ≤ b i ) = P ( a i T x − a i ˉ T x ∣ ∣ ∑ i 1 2 x ∣ ∣ 2 ≤ b i − a i ˉ T x ∣ ∣ ∑ i 1 2 x ∣ ∣ 2 ) = Φ ( b i − a i ˉ T x ∣ ∣ ∑ i 1 2 x ∣ ∣ 2 ) ≥ η P(a_i^Tx\leq b_i)=P(\frac{a_i^Tx-\bar{a_i}^Tx}{||\sum_i^{\frac{1}{2}}x||_2}\leq \frac{b_i-\bar{a_i}^Tx}{||\sum_i^{\frac{1}{2}}x||_2})=\Phi{(\frac{b_i-\bar{a_i}^Tx}{||\sum_i^{\frac{1}{2}}x||_2})}\geq \eta P(aiTxbi)=P(i21x2aiTxaiˉTxi21x2biaiˉTx)=Φ(i21x2biaiˉTx)η
  • 根据正态分布函数 Φ \Phi Φ的反函数推导: b i − a i ˉ T x ∣ ∣ ∑ i 1 2 x ∣ ∣ 2 ≥ Φ − 1 ( η ) ( η ≥ 1 2 ) \frac{b_i-\bar{a_i}^Tx}{||\sum_i^{\frac{1}{2}}x||_2}\geq\Phi^{-1}(\eta)(\eta\geq \frac{1}{2}) i21x2biaiˉTxΦ1(η)η21
    高斯分布 { C D F − c u m u l a t i v e − d i s t r i b u t i o n − f u n c t i o n 累 积 分 布 函 数 ( 单 增 ) P D F − p o s s i b i l i t y − d e n s i t y − f u n c t i o n 概 率 密 度 函 数 \begin{cases}CDF-cumulative-distribution-function累积分布函数(单增)\\PDF-possibility-density-function概率密度函数\end{cases} {CDFcumulativedistributionfunction()PDFpossibilitydensityfunction
  • 所以转化为求解SOCP问题 min ⁡ c T x , s . t a i ˉ T x + Φ − 1 ( η ) ∣ ∣ ∑ i 1 2 x ∣ ∣ 2 ≤ b i , i = 1 , . . . , m \min{c^Tx},s.t\quad\bar{a_i}^Tx+\Phi^{-1}(\eta)||\sum_i^{\frac{1}{2}}x||_2\leq b_i,i=1,...,m mincTx,s.taiˉTx+Φ1(η)i21x2bi,i=1,...,m

几何规划Geometric programming(GP)

引入限制函数

单项式函数monomial

定义: f ( x ) = c x 1 a 1 x 2 a 2 . . . x n a n , d o m f ∈ R + + n ( 正 数 ) , c > 0 f(x)=cx_1^{a_1}x_2^{a_2}...x_n^{a_n},domf\isin R_{++}^n(正数),c>0 f(x)=cx1a1x2a2...xnan,domfR++n(),c>0
f ( x ) 对 任 意 方 向 都 是 单 调 的 , x i a i 全 是 单 调 函 数 , 取 对 数 后 , 也 是 单 调 函 数 f(x)对任意方向都是单调的,x_i^{a_i}全是单调函数,取对数后,也是单调函数 f(x)xiai

多项式函数posynomial

定义: f ( x ) = ∑ k = 1 K c k x 1 a 1 k x 2 a 2 k . . . x n a n k , d o m f ∈ R + + n ( 正 数 ) , c k > 0 f(x)=\sum\limits_{k=1}^Kc_kx_1^{a_{1k}}x_2^{a_{2k}}...x_n^{a_{nk}},domf\isin R_{++}^n(正数),c_k>0 f(x)=k=1Kckx1a1kx2a2k...xnank,domfR++n(),ck>0

几何规划的凸优化形式

几何规划GP定义: min ⁡ f 0 ( x ) , s . t { f i ( x ) ≤ 1 , i = 1 , . . . , m , f i 是 多 项 式 函 数 h i ( x ) = 1 , i = 1 , . . . , m , h i 是 单 项 式 函 数 \min{f_0(x)},s.t\begin{cases}f_i(x)\leq1,i=1,...,m,f_i是多项式函数\\ h_i(x)=1,i=1,...,m,h_i是单项式函数\end{cases} minf0(x),s.t{fi(x)1,i=1,...,m,fihi(x)=1,i=1,...,m,hi

利用变量替换 y i = log ⁡ x i    ⟹    { 单 项 式 f → log ⁡ f ( e y 1 , . . . , e y n ) = ∑ a i y i + b ( b = log ⁡ c ) 多 项 式 f → log ⁡ f ( e y 1 , . . . , e y n ) = log ⁡ ( ∑ k = 1 K e ( a k T y + b k ) ) ( b k = log ⁡ c k ) y_i=\log{x_i}\implies\begin{cases}单项式f\rightarrow \log{f(e^{y_1},...,e^{y_n})}=\sum{a_iy_i}+b\quad(b=\log{c}) \\ 多项式f\rightarrow\log{f(e^{y_1},...,e^{y_n})}=\log{(\sum\limits_{k=1}^{K}e^{(a_k^Ty+b_k)})}\quad(b_k=\log{c_k})\end{cases} yi=logxiflogf(ey1,...,eyn)=aiyi+b(b=logc)flogf(ey1,...,eyn)=log(k=1Ke(akTy+bk))(bk=logck)

GP的凸优化形式: min ⁡ log ⁡ ( ∑ k = 1 K e ( a 0 k T y + b 0 k ) ) , s . t { log ⁡ ( ∑ k = 1 K e ( a i k T y + b i k ) ) ≤ 0 , i = 1 , . . . , m G y + d = 0 \min{\log{(\sum\limits_{k=1}^{K}e^{(a_{0k}^Ty+b_{0k})})}},s.t\begin{cases}\log{(\sum\limits_{k=1}^{K}e^{(a_{ik}^Ty+b_{ik})})}\leq 0,i=1,...,m\\ Gy+d=0\end{cases} minlog(k=1Ke(a0kTy+b0k)),s.tlog(k=1Ke(aikTy+bik))0,i=1,...,mGy+d=0
比如 log ⁡ ( Π ( y y ( 1 − y ) y ) ) \log{(\Pi(y^y(1-y)^y))} log(Π(yy(1y)y))

广义不等式约束generalized inequality constraints

就是将约束改为广义不等式
定义:凸优化问题 min ⁡ f 0 ( x ) , s . t { f i ( x ) ⪯ K i 0 , i = 1 , . . . , m A x = b \min{f_0(x)},s.t\quad\begin{cases}f_i(x)\preceq_{K_i}0,i=1,...,m\\ Ax=b\end{cases} minf0(x)s.t{fi(x)Ki0,i=1,...,mAx=b
其中: f 0 : R n → R 是 凸 函 数 ; f i : R n → R k i 在 好 锥 K i 的 定 义 域 内 是 凸 函 数 f_0:R^n\rightarrow R是凸函数;f_i:R^n\rightarrow R^{k_i}在好锥K_i的定义域内是凸函数 f0:RnRfi:RnRkiKi,他们都具备标准凸优化问题的性质:具有可行域凸集,局部最优就是全局最优

锥conic形式的线性规划

定义:凸优化问题 min ⁡ c T x , s . t { F x + g ⪯ K 0 , i = 1 , . . . , m A x = b \min{c^Tx},s.t\quad\begin{cases}Fx+g\preceq_{K}0,i=1,...,m\\ Ax=b\end{cases} mincTxs.t{Fx+gK0,i=1,...,mAx=b
其中: 当 K = R + m 时 , 问 题 转 化 为 线 性 规 划 L P 当K=R_+^m时,问题转化为线性规划LP K=R+m线LP

半正定规划Semidefinite program(SDP)

定义:凸优化问题 min ⁡ c T x , s . t { ∑ i = 1 n x i F i + G ⪯ 0 A x = b F i , G ∈ S k ( 对 称 矩 阵 ) \min{c^Tx},s.t\quad\begin{cases}\sum\limits_{i=1}^n{x_iF_i}+G\preceq 0\\ Ax=b \\ F_i,G\isin S^k(对称矩阵)\end{cases} mincTxs.ti=1nxiFi+G0Ax=bFi,GSk()

线性矩阵不等式linear matrix inequality(LMI):将多个不等关系合并在为一个不等式,要求是同时成立的。

{ x 1 F 1 ^ + . . . + x n F n ^ + G ^ ⪯ 0 x 1 F 1 ~ + . . . + x n F n ~ + G ~ ⪯ 0 \begin{cases}x_1\hat{F_1}+...+x_n\hat{F_n}+\hat{G}\preceq 0 \\ x_1\tilde{F_1}+...+x_n\tilde{F_n}+\tilde{G}\preceq 0\end{cases} {x1F1^+...+xnFn^+G^0x1F1~+...+xnFn~+G~0
   ⟺    x 1 [ F 1 ^ 0 0 F 1 ~ ] + . . . + x n [ F n ^ 0 0 F n ~ ] + [ G ^ 0 0 G ~ ] ⪯ 0 \iff x_1\begin{bmatrix}\hat{F_1}&0 \\ 0&\tilde{F_1}\end{bmatrix}+...+x_n\begin{bmatrix}\hat{F_n}&0 \\ 0&\tilde{F_n}\end{bmatrix}+\begin{bmatrix}\hat{G}&0 \\ 0&\tilde{G}\end{bmatrix}\preceq0 x1[F1^00F1~]+...+xn[Fn^00Fn~]+[G^00G~]0

LP as SDP

L P : min ⁡ c T x , s . t A x ⪯ b LP:\min{c^Tx},s.t\quad Ax\preceq b LP:mincTxs.tAxb
   ⟹    S D P : min ⁡ c T x , s . t d i a g ( A x − b ) ⪯ 0 \implies SDP:\min{c^Tx},s.t\quad diag(Ax-b)\preceq 0 SDP:mincTxs.tdiag(Axb)0

SOCP as SDP

S O C P : min ⁡ f T x , s . t ∣ ∣ A i x + b i ∣ ∣ 2 ≤ c i T x + d i , i = 1 , . . . , m SOCP:\min{f^Tx},s.t\quad ||A_ix+b_i||_2\leq c_i^Tx+d_i,i=1,...,m SOCP:minfTxs.tAix+bi2ciTx+di,i=1,...,m
   ⟹    S D P : min ⁡ f T x , s . t [ ( c i T x + d i ) I A i x + b i ( A i x + b i ) T c i T x + d i ] ⪰ 0 , i = 1 , . . . , m \implies SDP:\min{f^Tx},s.t\quad \begin{bmatrix}(c_i^Tx+d_i)I&A_ix+b_i\\(A_ix+b_i)^T&c_i^Tx+d_i\end{bmatrix}\succeq 0,i=1,...,m SDP:minfTxs.t[(ciTx+di)I(Aix+bi)TAix+biciTx+di]0,i=1,...,m
注意:需要保证上面矩阵的特征值都大于0,可以利用舒尔补进行证明

  • 舒尔补:A是非奇异的,A在M中的舒尔补: D − C A − 1 B D-CA^{-1}B DCA1B
    ∣ M ∣ = ∣ A B C D ∣ = A 做 初 等 对 角 化 ∣ A 0 0 D − C A − 1 B ∣ = ∣ A ∣ ∣ D − C A − 1 B ∣ |M|=\begin{vmatrix}A & B \\ C & D\end{vmatrix}\xlongequal{A做初等对角化}\begin{vmatrix}A & 0 \\ 0 & D-CA^{-1}B\end{vmatrix}=|A||D-CA^{-1}B| M=ACBDA A00DCA1B=ADCA1B
       ⟹    ∣ ( c i T x + d i ) I 0 0 c i T x + d i − ( A i x + b i ) T [ ( c i T x + d i ) I ] − 1 ( A i x + b i ) ∣ \implies\begin{vmatrix}(c_i^Tx+d_i)I & 0 \\ 0 & c_i^Tx+d_i-(A_ix+b_i)^T[(c_i^Tx+d_i)I]^{-1}(A_ix+b_i)\end{vmatrix} (ciTx+di)I00ciTx+di(Aix+bi)T[(ciTx+di)I]1(Aix+bi)

  • 所以要求满足 { c i T x + d i ≥ 0 c i T x + d i − ( A i x + b i ) T [ ( c i T x + d i ) I ] − 1 ( A i x + b i ) ≥ 0 \begin{cases}c_i^Tx+d_i\geq 0\\c_i^Tx+d_i-(A_ix+b_i)^T[(c_i^Tx+d_i)I]^{-1}(A_ix+b_i)\geq 0\end{cases} {ciTx+di0ciTx+di(Aix+bi)T[(ciTx+di)I]1(Aix+bi)0

  • ∣ M ∣ = ( c i T x + d i ) 2 − ∣ ∣ A i x + b i ∣ ∣ 2 2 = 根 据 S O C P 的 条 件 ∣ M ∣ ≥ 0 ( 得 证 ) |M|=(c_i^Tx+d_i)^2-||A_ix+b_i||_2^2\xlongequal{根据SOCP的条件}|M|\geq 0(得证) M=(ciTx+di)2Aix+bi22SOCP M0()

特征值最小化Eigenvalue minimization

定义:凸优化问题 min ⁡ λ m a x ( A ( x ) ) , s . t { A ( x ) = A 0 + x 1 A 1 + . . . + x n A n A i ∈ S k ( 对 称 矩 阵 ) \min{\lambda_{max}(A(x))},s.t\quad\begin{cases}A(x)=A_0+x_1A_1+...+x_nA_n \\ A_i\isin S^k(对称矩阵)\end{cases} minλmax(A(x))s.t{A(x)=A0+x1A1+...+xnAnAiSk()

   ⟹    S D P : min ⁡   t , s . t A ( x ) ⪯ t I , x ∈ R n , t ∈ R \implies SDP:\min{\space t},s.t\quad A(x)\preceq tI,x\isin R^n,t\isin R SDP:min ts.tA(x)tI,xRn,tR
其中: A ( x ) ⪯ t I    ⟺    λ m a x ( A ) ≤ t A(x)\preceq tI\iff \lambda_{max}(A)\leq t A(x)tIλmax(A)t

矩阵范数最小化Matrix norm minimization

定义:凸优化问题 min ⁡ ∣ ∣ A ( x ) ∣ ∣ 2 = ( λ m a x ( A ( x ) T A ( X ) ) ) 1 2 , s . t { A ( x ) = A 0 + x 1 A 1 + . . . + x n A n A i ∈ R p × q ( 对 称 矩 阵 ) \min{||A(x)||_2=(\lambda_{max}(A(x)^TA(X)))^{\frac{1}{2}}},s.t\quad\begin{cases}A(x)=A_0+x_1A_1+...+x_nA_n \\ A_i\isin R^{p\times q}(对称矩阵)\end{cases} minA(x)2=(λmax(A(x)TA(X)))21s.t{A(x)=A0+x1A1+...+xnAnAiRp×q()
   ⟹    S D P : min ⁡   t , s . t [ t I A ( x ) A ( x ) T t I ] ⪰ 0 , x ∈ R n , t ∈ R \implies SDP:\min{\space t},s.t\quad\begin{bmatrix}tI&A(x)\\A(x)^T&tI\end{bmatrix}\succeq 0,x\isin R^n,t\isin R SDP:min ts.t[tIA(x)TA(x)tI]0,xRn,tR

其中: ∣ ∣ A ( x ) ∣ ∣ 2 ≤ t    ⟺    A T A ⪯ t 2 I , t ≥ 0    ⟺    [ t I A ( x ) A ( x ) T t I ] ⪰ 0 ||A(x)||_2\leq t\iff A^TA\preceq t^2I,t\geq 0\iff \begin{bmatrix}tI&A(x)\\A(x)^T&tI\end{bmatrix}\succeq 0 A(x)2tATAt2I,t0[tIA(x)TA(x)tI]0,也是利用舒尔补证明

向量优化vector optimization

就是将传统的目标函数改为广义目标函数
min ⁡ K ∈ R q , f 0 : R n → R q f 0 ( x ) , s . t { f i ( x ) ≤ 0 , i = 1 , . . . , m h i ( x ) = 0 , i = 1 , . . . , p \min\limits_{K\isin R^q,f_0:R^n\rightarrow R^q} f_0(x),s.t \begin{cases}f_i(x)\leq0,i=1,...,m \\ h_i(x)=0,i=1,...,p\end{cases} KRq,f0:RnRqminf0(x)s.t{fi(x)0,i=1,...,mhi(x)=0,i=1,...,p
   ⟺    min ⁡ f 0 : K − c o n v e x , f i : c o n v e x f 0 ( x ) , s . t { f i ( x ) ≤ 0 , i = 1 , . . . , m A x = b \iff\min\limits_{f_0:K-convex,f_i:convex} f_0(x),s.t \begin{cases}f_i(x)\leq0,i=1,...,m \\ Ax=b\end{cases} f0:Kconvex,fi:convexminf0(x)s.t{fi(x)0,i=1,...,mAx=b

全局Optimal和帕累托Pareto最小值

  • 全局最小值optimal,对于多目标,任意其他值都比 f 0 ( x ∗ ) f_0(x^*) f0(x)
    在这里插入图片描述
  • 局部最小值parato,对于单目标,任意其他值都比 f 0 ( x p o ) f_0(x^{po}) f0(xpo)大;但对于多目标,不是所有值都大于 f 0 ( x p o ) f_0(x^{po}) f0(xpo)
    在这里插入图片描述

多中心Multicriterion优化

定义:向量优化问题 min ⁡ f 0 ( x ) = ( F 1 ( x ) , . . . , F q ( x ) ) , s . t { q 个 目 标 函 数 F i K ∈ R + q ( 非 负 ) x ∗ − o p t i m a l y − f e a s i b l e    ⟹    f 0 ( x ∗ ) ⪯ f 0 ( y ) x p o − P a r e t o y − f e a s i b l e , f 0 ( y ) ⪯ f 0 ( x p o )    ⟹    f 0 ( x p o ) = f 0 ( y ) \min{f_0(x)=(F_1(x),...,F_q(x))},s.t\quad\begin{cases}q个目标函数F_i&K\isin R_+^q(非负)\\x^*-optimal&y-feasible\implies f_0(x^*)\preceq f_0(y)\\x^{po}-Pareto&y-feasible,f_0(y)\preceq f_0(x^{po})\implies f_0(x^{po})=f_0(y)\end{cases} minf0(x)=(F1(x),...,Fq(x)),s.tqFixoptimalxpoParetoKR+q()yfeasiblef0(x)f0(y)yfeasible,f0(y)f0(xpo)f0(xpo)=f0(y)

也就是如果多目标最优点optimal存在,那么结果就是唯一的;如果只存在部分目标的最优点Pareto,那么在他们对于相同目标函数(可比的)情况下,Pareto点是最小值

多目标的形成

希望在拟合时,不仅仅是逼近,而是保证其他优良特性(e.g.稀疏值最小,模最小等)

正则化的最小二乘Regularized least-squares

定义: min ⁡ w . r . t . R + 2 ( ∣ ∣ A x − b ∣ ∣ 2 2 , ∣ ∣ x ∣ ∣ 2 2 ) \min\limits_{w.r.t.R_+^2}{(||Ax-b||_2^2,||x||_2^2)} w.r.t.R+2min(Axb22,x22)
在这里插入图片描述

风险投资优化Risk return trade-off in portfolio optimization

定义: min ⁡ w . r . t . R + 2 ( − p ˉ T x , x T ∑ x ) , s . t 1 T x = 1 , x ⪰ 0 \min\limits_{w.r.t.R_+^2}{(-\bar{p}^Tx,x^T\sum x)},s.t\quad 1^Tx=1,x\succeq0 w.r.t.R+2min(pˉTx,xTx),s.t1Tx=1,x0
比如在风险投资优化中,既希望期望收入高,又希望损失风险(方差)最小
在这里插入图片描述

标量化Scalarization

针对多目标函数,找出所有权重方式的Pareto点,从中选出一种折中的方案
定义:标量问题 min ⁡ f i n d λ ≻ K ∗ 0 λ T f 0 ( x ) , s . t { f i ( x ) ≤ 0 , i = 1 , . . . , m h i ( x ) = 0 , i = 1 , . . . , p \min\limits_{find_{\lambda\succ_{K^*}0}}{\lambda^Tf_0(x)},s.t\quad\begin{cases}f_i(x)\leq0,i=1,...,m \\ h_i(x)=0,i=1,...,p\end{cases} findλK0minλTf0(x),s.t{fi(x)0,i=1,...,mhi(x)=0,i=1,...,p
在这里插入图片描述

常见标量化用法

利用加权的方式: λ T f 0 ( x ) = λ 1 F 1 ( x ) + . . . + λ q F q ( x ) \lambda^Tf_0(x)=\lambda_1F_1(x)+...+\lambda_qF_q(x) λTf0(x)=λ1F1(x)+...+λqFq(x)

最小二乘法&投资风险优化

最小二乘法-加权: min ⁡ λ = ( 1 , γ ) , γ > 0 ( ∣ ∣ A x − b ∣ ∣ 2 2 + γ ∣ ∣ x ∣ ∣ 2 2 ) \min\limits_{\lambda=(1,\gamma),\gamma>0}{(||Ax-b||_2^2+\gamma||x||_2^2)} λ=(1,γ),γ>0min(Axb22+γx22)
在这里插入图片描述
投资风险优化-加权: min ⁡ γ > 0 − p ˉ T x + γ x T ∑ x , s . t 1 T x = 1 , x ⪰ 0 \min\limits_{\gamma>0}{-\bar{p}^Tx+\gamma x^T\sum x},s.t\quad 1^Tx=1,x\succeq0 γ>0minpˉTx+γxTx,s.t1Tx=1,x0

总结

  • 凸优化问题及其标准形式

    • 凸优化问题
      min ⁡ x f 0 ( x ) , s . t { f i ( x ) ≤ 0 , i = 1 , . . . , m h i ( x ) = 0 , i = 1 , . . . , p \min\limits_x f_0(x),s.t \begin{cases}f_i(x)\leq0,i=1,...,m \\ h_i(x)=0,i=1,...,p\end{cases} xminf0(x)s.t{fi(x)0,i=1,...,mhi(x)=0,i=1,...,p
    • 可行域问题
      x 使 得 f 0 ( x ) = 0 , s . t { f i ( x ) ≤ 0 , i = 1 , . . . , m h i ( x ) = 0 , i = 1 , . . . , p x使得f_0(x)=0,s.t\begin{cases}f_i(x)\leq 0,i=1,...,m \\ h_i(x)=0,i=1,...,p \end{cases} x使f0(x)=0s.t{fi(x)0,i=1,...,mhi(x)=0,i=1,...,p
  • 局部最小值和全局最小值问题

    • 定义1:非空集合里存在满足约束的元素x,且x属于 f 0 f_0 f0的定义域内( x ∈ d o m f 0 x\isin domf_0 xdomf0)。
    • 定义2:非空集里的元素x使得 f 0 ( x ) = p ∗ ( 就 是 ∞ ) f_0(x)=p^*(就是\infty) f0(x)=p(),那么x就是目标函数的最优点。
    • 定义3: X o p t 是 最 优 点 x 的 集 合 X_{opt}是最优点x的集合 Xoptx。(极值表现为某一段水平线)
    • 定义4:如果存在 R > 0 R>0 R>0且满足 x 0 是 f 0 ( x ) x_0是f_0(x) x0f0(x)的最优点 ( s . t { f i ( x ) ≤ 0 , i = 1 , . . . , m h j ( x ) = 0 , j = 1 , . . . , p ∣ ∣ x − x 0 ∣ ∣ 2 ≤ R ) \begin{pmatrix}s.t \begin{cases}f_i(x)\leq0,i=1,...,m \\ h_j(x)=0,j=1,...,p \\ ||x-x_0||_2\leq R\end{cases}\end{pmatrix} s.tfi(x)0,i=1,...,mhj(x)=0,j=1,...,pxx02R,那么 x 0 x_0 x0就是局部最优点。(多个极值)
    • 定理:凸优化问题的任意一个局部最优点就是全局最优点
  • 可微函数的最优性条件

    • 定义 f 0 ( x ) 可 导 f_0(x)可导 f0(x)
      x , y ∈ x,y\isin x,y可行解,且 ∀ y , 有 ▽ f 0 ( x ) T ( y − x ) ≥ 0    ⟺    x \forall y,有\triangledown f_0(x)^T(y-x)\geq 0\iff x y,f0(x)T(yx)0x是最优点
    • 性质
      1.可行解集X是凸集
      2. − ▽ f 0 ( x ) -\triangledown f_0(x) f0(x)是函数下降的方向,说明沿下降方向已无更优可行解
      3. − ▽ f 0 ( x ) -\triangledown f_0(x) f0(x)定义出一个(垂直)的支撑面supporting hyperplane
    • 无约束问题的条件
      x ∈ d o m f 0 , ▽ f 0 ( x ) = 0    ⟺    x x\isin dom f_0,\triangledown f_0(x)=0\iff x xdomf0,f0(x)=0x是最优点
    • 等式约束问题的条件
      min ⁡ f 0 ( x ) , s . t   A x = b \min{f_0(x)},s.t\space Ax=b minf0(x),s.t Ax=b
      ∃ μ , s . t   x ∈ d o m f 0 , A x = b , ▽ f 0 ( x ) = A T μ    ⟺    x \exist \mu,s.t\space x\isin domf_0,Ax=b,\triangledown f_0(x)=A^T\mu\iff x μ,s.t xdomf0,Ax=b,f0(x)=ATμx是最优点
    • 特殊问题的条件
      min ⁡ f 0 ( x ) , s . t { x ≥ 0 d o m f 0 = R + n \min{f_0(x)},s.t\begin{cases} x\geq0 \\ domf_0=R_+^n \end{cases} minf0(x),s.t{x0domf0=R+n
      x ∈ d o m f 0 , x ≥ 0 , { ▽ T f 0 ( x ) i ≥ 0 x i = 0 ▽ T f 0 ( x ) i = 0 x i > 0    ⟺    x x\isin domf_0,x\geq 0,\begin{cases} \triangledown^Tf_0(x)_i\geq 0 & x_i=0 \\ \triangledown^Tf_0(x)_i=0&x_i>0 \end{cases}\iff x xdomf0,x0,{Tf0(x)i0Tf0(x)i=0xi=0xi>0x是最优点
  • 等价凸优化问题

    • 消除等式约束
      min ⁡ f 0 ( F z + x 0 ) , s . t   f i ( F z + x 0 ) ≤ 0 , i = 1 , . . . , m \min{f_0(Fz+x_0)},s.t\space f_i(Fz+x_0)\leq 0,i=1,...,m minf0(Fz+x0),s.t fi(Fz+x0)0,i=1,...,m
    • 引入等式约束
      min ⁡ f 0 ( y 0 ) , s . t { f i ( y i ) ≤ 0 , i = 1 , . . . , m y i = A i x + b i , i = 0 , 1 , . . . , m \min{f_0(y_0)},s.t\begin{cases} f_i(y_i)\leq 0,i=1,...,m \\ y_i=A_ix+b_i,i=0,1,...,m \end{cases} minf0(y0),s.t{fi(yi)0,i=1,...,myi=Aix+bi,i=0,1,...,m
    • 不等式约束变成等式约束
      min ⁡ f 0 ( x ) , s . t { a i T x + s i = b i , i = 1 , . . . , m s i ≥ 0 , i = 1 , . . . , m \min{f_0(x)},s.t\begin{cases} a_i^Tx+s_i=b_i,i=1,...,m \\ s_i\geq 0,i=1,...,m \end{cases} minf0(x),s.t{aiTx+si=bi,i=1,...,msi0,i=1,...,m
    • epigraph形式
      min ⁡ ( x , t ) t , s . t { f 0 ( x ) − t ≤ 0 ( 凸 函 数 ) f i ( x ) ≤ 0 , i = 1 , . . . , m A x = b \min\limits_{(x,t)}{t},s.t\begin{cases} f_0(x)-t\leq 0(凸函数) \\ f_i(x)\leq 0,i=1,...,m \\ Ax=b \end{cases} (x,t)mint,s.tf0(x)t0()fi(x)0,i=1,...,mAx=b
    • 最小化一些无关变量
      min ⁡ f 0 ~ ( x 1 ) = inf ⁡ x 2 f 0 ( x 1 , x 2 ) , s . t   f i ( x 1 ) ≤ 0 , i = 1 , . . . , m \min\widetilde{f_0}(x_1)=\inf\limits_{x_2}f_0(x_1,x_2),s.t\space f_i(x_1)\leq 0,i=1,...,m minf0 (x1)=x2inff0(x1,x2)s.t fi(x1)0,i=1,...,m
  • 次凸优化问题

    • 次凸函数
      次 凸 函 数 f 0 ( x ) , m 个 凸 函 数 f i ( x ) 次凸函数f_0(x),m个凸函数f_i(x) f0(x),mfi(x)
      min ⁡ f 0 ( x ) , s . t { f i ( x ) ≤ 0 , i = 1 , . . . , m A x = b \min{f_0(x)},s.t\begin{cases} f_i(x)\leq 0,i=1,...,m \\ Ax=b \end{cases} minf0(x),s.t{fi(x)0,i=1,...,mAx=b
    • 次凸函数向凸函数的转化
      对 于 一 个 次 凸 函 数 f 0 , 转 化 为 一 系 列 的 多 个 凸 函 数 ϕ t ( x ) , ∀ t 使 得 对 于 x 来 说 , f 0 ( x ) ≤ t    ⟺    ϕ t ( x ) ≤ 0 对于一个次凸函数f_0,转化为一系列的多个凸函数\phi_t(x),\forall t使得对于x来说,f_0(x)\leq t\iff \phi_t(x)\leq0 f0ϕt(x)t使xf0(x)tϕt(x)0
    • 次凸问题转换为可行域问题:二分法求解极小值
      f i n d   x , s . t { ϕ t ( x ) ≤ 0 f i ( x ) ≤ 0 , i = 1 , . . . , m A x = b find\space x,s.t\begin{cases}\phi_t(x)\leq 0 \\ f_i(x)\leq 0,i=1,...,m \\ Ax=b \end{cases} find x,s.tϕt(x)0fi(x)0,i=1,...,mAx=b
  • 线性优化

    • 线性规划LP
      凸优化问题 min ⁡ c T x + d , s . t { G x ≤ h A x = b \min{c^Tx+d},s.t\begin{cases} Gx\leq h \\ Ax=b \end{cases} mincTx+d,s.t{GxhAx=b
    • 线性分式规划
      次凸优化问题 min ⁡ f 0 ( x ) = c T x + d e T x + f , s . t { G x ≤ h A x = b \min{f_0(x)=\frac{c^Tx+d}{e^Tx+f}},s.t\begin{cases} Gx\leq h \\ Ax=b \end{cases} minf0(x)=eTx+fcTx+d,s.t{GxhAx=b
      d o m f 0 ( x ) = { x ∣ e T x + f > 0 } domf_0(x)=\{x|e^Tx+f>0\} domf0(x)={xeTx+f>0}
    • 扩展线性分式规划
      次凸优化问题 f 0 ( x ) = max ⁡ i = 1 , . . . , r c i T x + d i e i T x + f i , d o m f 0 ( x ) = { x ∣ e i T x + f i > 0 , i = 1 , . . . , r } {f_0(x)=\max\limits_{i=1,...,r}\frac{c_i^Tx+d_i}{e_i^Tx+f_i}},domf_0(x)=\{x|e_i^Tx+f_i>0,i=1,...,r\} f0(x)=i=1,...,rmaxeiTx+ficiTx+di,domf0(x)={xeiTx+fi>0,i=1,...,r}
  • 二次规划

    • 普通二次规划QP
      定义: min ⁡ 1 2 x T P x + q T x + r , s . t { G x ≤ h A x = b P ∈ S + n ( 半 正 定 的 对 称 矩 阵 ) \min{\frac{1}{2}x^TPx+q^Tx+r},s.t\begin{cases}Gx\leq h \\ Ax=b \\ P\isin S_+^n(半正定的对称矩阵)\end{cases} min21xTPx+qTx+r,s.tGxhAx=bPS+n()
    • 二次约束的二次规划QCQP
      定义: min ⁡ 1 2 x T P 0 x + q 0 T x + r 0 , s . t { 1 2 x T P i x + q i T x + r i ≤ 0 , i = 1 , . . . , m A x = b P i ∈ S + n ( 半 正 定 的 对 称 矩 阵 ) \min{\frac{1}{2}x^TP_0x+q_0^Tx+r_0},s.t\begin{cases} \frac{1}{2}x^TP_ix+q_i^Tx+r_i\leq 0,i=1,...,m\\ Ax=b \\P_i\isin S_+^n(半正定的对称矩阵)\end{cases} min21xTP0x+q0Tx+r0,s.t21xTPix+qiTx+ri0,i=1,...,mAx=bPiS+n()
  • 二阶锥约束的线性规划SOCP
    定义: min ⁡ f T x , s . t { ∣ ∣ A i x + b i ∣ ∣ 2 ≤ c i T x + d i , i = 1 , . . . , m F x = g \min{f^Tx},s.t\begin{cases}||A_ix+b_i||_2\leq c_i^Tx+d_i,i=1,...,m\\ Fx=g \end{cases} minfTx,s.t{Aix+bi2ciTx+di,i=1,...,mFx=g

  • 带随机变量的线性规划RLP

    • 定义: min ⁡ c T x , s . t a i T x ≤ b i , i = 1 , . . . , m \min{c^Tx},s.t\quad a_i^Tx\leq b_i,i=1,...,m mincTxs.taiTxbi,i=1,...,m
    • 确定模型转化为求解SOCP问题
      min ⁡ c T x , s . t ∣ ∣ P i T x ∣ ∣ 2 ≤ − a i ˉ T x + b i , i = 1 , . . . , m \min{c^Tx},s.t\quad||P_i^Tx||_2\leq -\bar{a_i}^Tx+b_i,i=1,...,m mincTx,s.tPiTx2aiˉTx+bi,i=1,...,m
    • 概率模型转化为求解SOCP问题
      min ⁡ c T x , s . t a i ˉ T x + Φ − 1 ( η ) ∣ ∣ ∑ i 1 2 x ∣ ∣ 2 ≤ b i , i = 1 , . . . , m \min{c^Tx},s.t\quad\bar{a_i}^Tx+\Phi^{-1}(\eta)||\sum_i^{\frac{1}{2}}x||_2\leq b_i,i=1,...,m mincTx,s.taiˉTx+Φ1(η)i21x2bi,i=1,...,m
  • 几何规划

    • 普通几何规划GP:
      定义: min ⁡ f 0 ( x ) , s . t { f i ( x ) ≤ 1 , i = 1 , . . . , m , f i 是 多 项 式 函 数 h i ( x ) = 1 , i = 1 , . . . , m , h i 是 单 项 式 函 数 \min{f_0(x)},s.t\begin{cases}f_i(x)\leq1,i=1,...,m,f_i是多项式函数\\ h_i(x)=1,i=1,...,m,h_i是单项式函数\end{cases} minf0(x),s.t{fi(x)1,i=1,...,m,fihi(x)=1,i=1,...,m,hi
    • GP的凸优化形式(变量替换&取对数):
      min ⁡ log ⁡ ( ∑ k = 1 K e ( a 0 k T y + b 0 k ) ) , s . t { log ⁡ ( ∑ k = 1 K e ( a i k T y + b i k ) ) ≤ 0 , i = 1 , . . . , m G y + d = 0 \min{\log{(\sum\limits_{k=1}^{K}e^{(a_{0k}^Ty+b_{0k})})}},s.t\begin{cases}\log{(\sum\limits_{k=1}^{K}e^{(a_{ik}^Ty+b_{ik})})}\leq 0,i=1,...,m\\ Gy+d=0\end{cases} minlog(k=1Ke(a0kTy+b0k)),s.tlog(k=1Ke(aikTy+bik))0,i=1,...,mGy+d=0
  • 广义不等式约束

    • 好锥范围下的凸优化
      定义:凸优化问题 min ⁡ f 0 ( x ) , s . t { f i ( x ) ⪯ K i 0 , i = 1 , . . . , m A x = b \min{f_0(x)},s.t\quad\begin{cases}f_i(x)\preceq_{K_i}0,i=1,...,m\\ Ax=b\end{cases} minf0(x)s.t{fi(x)Ki0,i=1,...,mAx=b
    • 锥形式的线性规划
      定义:凸优化问题 min ⁡ c T x , s . t { F x + g ⪯ K 0 , i = 1 , . . . , m A x = b \min{c^Tx},s.t\quad\begin{cases}Fx+g\preceq_{K}0,i=1,...,m\\ Ax=b\end{cases} mincTxs.t{Fx+gK0,i=1,...,mAx=b
    • 半正定规划SDP
      定义:凸优化问题 min ⁡ c T x , s . t { ∑ i = 1 n x i F i + G ⪯ 0 , F i , G ∈ S k ( 对 称 矩 阵 ) A x = b \min{c^Tx},s.t\quad\begin{cases}\sum\limits_{i=1}^n{x_iF_i}+G\preceq 0,\quad F_i,G\isin S^k(对称矩阵)\\ Ax=b \end{cases} mincTxs.ti=1nxiFi+G0,Fi,GSk()Ax=b
      • LP as SDP
        min ⁡ c T x , s . t d i a g ( A x − b ) ⪯ 0 \min{c^Tx},s.t\quad diag(Ax-b)\preceq 0 mincTxs.tdiag(Axb)0
      • SOCP as SDP
        min ⁡ f T x , s . t [ ( c i T x + d i ) I A i x + b i ( A i x + b i ) T c i T x + d i ] ⪰ 0 , i = 1 , . . . , m \min{f^Tx},s.t\quad \begin{bmatrix}(c_i^Tx+d_i)I&A_ix+b_i\\(A_ix+b_i)^T&c_i^Tx+d_i\end{bmatrix}\succeq 0,i=1,...,m minfTxs.t[(ciTx+di)I(Aix+bi)TAix+biciTx+di]0,i=1,...,m
  • 多目标函数标量化(向量优化)

    • 普通凸优化
      定义:向量优化问题 min ⁡ f 0 ( x ) = ( F 1 ( x ) , . . . , F q ( x ) ) , s . t { q 个 目 标 函 数 F i K ∈ R + q ( 非 负 ) x ∗ − o p t i m a l y − f e a s i b l e    ⟹    f 0 ( x ∗ ) ⪯ f 0 ( y ) x p o − P a r e t o y − f e a s i b l e , f 0 ( y ) ⪯ f 0 ( x p o )    ⟹    f 0 ( x p o ) = f 0 ( y ) \min{f_0(x)=(F_1(x),...,F_q(x))},s.t\quad\begin{cases}q个目标函数F_i&K\isin R_+^q(非负)\\x^*-optimal&y-feasible\implies f_0(x^*)\preceq f_0(y)\\x^{po}-Pareto&y-feasible,f_0(y)\preceq f_0(x^{po})\implies f_0(x^{po})=f_0(y)\end{cases} minf0(x)=(F1(x),...,Fq(x)),s.tqFixoptimalxpoParetoKR+q()yfeasiblef0(x)f0(y)yfeasible,f0(y)f0(xpo)f0(xpo)=f0(y)
    • 标量化
      定义:标量问题 min ⁡ f i n d λ ≻ K ∗ 0 λ T f 0 ( x ) , s . t { f i ( x ) ≤ 0 , i = 1 , . . . , m h i ( x ) = 0 , i = 1 , . . . , p \min\limits_{find_{\lambda\succ_{K^*}0}}{\lambda^Tf_0(x)},s.t\quad\begin{cases}f_i(x)\leq0,i=1,...,m \\ h_i(x)=0,i=1,...,p\end{cases} findλK0minλTf0(x),s.t{fi(x)0,i=1,...,mhi(x)=0,i=1,...,p
  • 各种规划问题的汇总对比【个人理解】

优化问题目标函数限制函数
线性规划LP线性函数(凸)线性不等式约束;线性等式约束
线性分式规划线性分式(次凸)线性不等式约束;线性等式约束
扩展线性分式规划线性分式(次凸+max保凸)线性不等式约束
二次规划QP二次函数(凸)线性不等式约束;线性等式约束
二次约束的二次规划QCQP二次函数(凸)二次不等式约束(凸);线性等式约束
二阶锥约束的线性规划SOCP线性函数(凸)二阶锥不等式约束(凸);线性等式约束
稳健的线性规划RLP含随机变量的线性函数(凸)含随机变量的线性不等式约束
几何规划GP多项式函数(取对数-凸)多项式不等式约束;单项式线性等式约束
广义不等式约束的线性规划线性函数(凸)广义不等式约束(可线性);线性等式约束
半正定的规划SDP线性函数(凸)线性矩阵不等式约束LMI;线性等式约束
向量优化向量线性不等式约束;线性等式约束
多目标函数规划–标量化多个目标加权函数线性不等式约束;线性等式约束
  • 规划问题的转换思想
    在这里插入图片描述

Reference

总结1
总结2
凸优化PPT

  • 6
    点赞
  • 65
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值