《凸优化读书笔记》第三篇:凸集进阶之保凸运算、分离与支撑超平面、对偶锥与广义不等式

前言

实际工作中大量的决策问题,如计算广告中的部分机制策略问题、物流行业的路径规划问题甚至机器学习中的优化问题,都可以表示为数学优化问题,或者数学优化问题的变化形式如多目标优化问题。因此,接下来一段时间将会持续更新数学优化中的凸优化问题和整数规划问题相关知识总结
本篇是《凸优化读书笔记》系列的第二篇,主要讲述凸集相关的基本概念以及几种常见的凸集类型

一、相关概念

1.1 仿射集合

1.1.1 仿射集合的概念

零空间:在数学中,一个算子 A A A的零空间是方程 A v = 0 Av=0 Av=0所有解 v v v的集合,也叫做 A A A的核空间
仿射集合:如果 C C C是一个仿射集合,那它满足:如果 x 1 , . . . , x k ∈ C x_{1},...,x_{k} \in C x1,...,xkC θ 1 + θ 2 + . . . + θ k = 1 \theta_{1}+\theta_{2}+...+\theta_{k}=1 θ1+θ2+...+θk=1,那么 θ 1 x 1 + . . . + θ k x k \theta_{1}x_{1}+...+\theta_{k}x_{k} θ1x1+...+θkxk仍然在集合 C C C
子空间:如果 C C C是一个仿射集合且 x 0 ∈ C x_{0} \in C x0C,那么集合 V = C − x 0 = { x − x 0 ∣ x ∈ C } V=C-x_{0}=\{x-x_{0}|x \in C\} V=Cx0={xx0xC}是一个子空间
仿射包:集合 C C C中的点的所有仿射组合组成的集合称作 C C C的仿射包,记为aff C。仿射包是包含 C C C的最小仿射集合

1.1.2 线性方程组的解集

线性方程组的解集 C = { x ∣ A x = b } C=\{x|Ax=b\} C={xAx=b}是一个仿射集合,这个结论很容易证明。设 x 1 , x 2 ∈ C x_{1},x_{2} \in C x1,x2C,即 A x 1 = b , A x 2 = b Ax_{1}=b,Ax_{2}=b Ax1=b,Ax2=b。对于任意 θ \theta θ有:

A ( θ x 1 + ( 1 − θ ) x 2 ) = θ A x 1 + ( 1 − θ ) A x 2 = θ b + ( 1 − θ ) b = b \begin{aligned} A(\theta x_{1}+(1-\theta)x_{2})&=\theta Ax_{1}+(1-\theta)Ax_{2} \\ &=\theta b + (1-\theta)b \\ &=b \end{aligned} A(θx1+(1θ)x2)=θAx1+(1θ)Ax2=θb+(1θ)b=b

这说明任意的仿射组合 θ x 1 + ( 1 − θ ) x 2 \theta x_{1}+(1-\theta)x_{2} θx1+(1θ)x2也在集合 C C C中,且与仿射集合 C C C相关联的子空间就是 A A A的零空间
反之任意仿射组合都可以表示为一个线性方程组的解集

1.1.3 仿射维度和相对内部

仿射维数:集合 C C C的仿射维数是其仿射包的维数。举个例子说明, R 2 R^{2} R2上的单位圆环 { x ∈ R 2 ∣ x 1 2 + x 2 2 = 1 } \{x \in R^{2}|x_{1}^{2}+x_{2}^{2}=1\} {xR2x12+x22=1},它的仿射包是全空间 R 2 R^{2} R2,所以其仿射维数是2
闭包:当一个集合 S 在某个运算下不闭合的时候,我们通常可以找到包含 S 的最小的闭合集合。这个最小闭合集合被称为 S 的(关于这个运算的)闭包
相对内部:集合 C C C的相对内部定义如下:

r e l i n t   C = { x ∈ C ∣ B ( x , r ) ∩ a f f   C } relint {\,} C=\{x \in C|B(x,r) \cap aff {\,} C\} relintC={xCB(x,r)affC}

其中 B ( x , r ) = { y ∣   ∣ ∣ y − x ∣ ∣ ≤ r } B(x,r)=\{y|{\,}||y-x|| \leq r\} B(x,r)={yyxr},即半径为r,中心为x并有范数 ∣ ∣ . ∣ ∣ ||.|| .定义的球
相对边界:集合 C C C的相对边界为 c l   C / r e l i n t   C cl{\,}C / relint{\,}C clC/relintC,其中 c l   C cl{\,}C clC是集合C的闭包

1.1.4 三维空间中的相对边界

考虑 R 3 R^{3} R3中处于 ( x 1 , x 2 ) (x_{1},x_{2}) (x1,x2)平面的一个正方形,即:

C = { x ∈ R 3 ∣ − 1 ≤ x 1 ≤ 1 , − 1 ≤ x 2 ≤ 1 , x 3 = 0 } C=\{x \in R^{3}|-1 \leq x_{1} \leq 1,-1 \leq x_{2} \leq 1, x_{3=0}\} C={xR31x11,1x21,x3=0}

其仿射包为 ( x 1 , x 2 ) (x_{1},x_{2}) (x1,x2)所在平面,相对内部为:

r e l i n t   C = { x ∈ R 3 ∣ − 1 ≤ x 1 ≤ 1 , − 1 ≤ x 2 ≤ 1 , x 3 = 0 } relint{\,}C=\{x \in R^{3}|-1 \leq x_{1} \leq 1,-1 \leq x_{2} \leq 1, x_{3=0}\} relintC={xR31x11,1x21,x3=0}

C C C的边界是其自身,相对边界是其边框:

{ x ∈ R 3 ∣ m a x { ∣ x 1 , ∣ x 2 ∣ } = 1 , x 3 = 0 } \{x \in R^{3}|max\{|x_{1},|x_{2}|\}=1,x_{3=0}\} {xR3max{x1,x2}=1,x3=0}

1.2 凸集的概念

凸集:如果 C C C中任意两点间的线段仍然在 C C C中,即对于任意 x 1 , x 2 ∈ C x_{1},x_{2}\in C x1,x2C 0 ≤ θ ≤ 1 0 \leq \theta \leq 1 0θ1有:

θ x 1 + ( 1 − θ ) x 2 ∈ C \theta x_{1} + (1-\theta)x_{2} \in C θx1+(1θ)x2C

那么 C C C就是凸集
凸组合:点 θ 1 x 1 + . . . + θ k x k \theta_{1}x_{1}+...+\theta_{k}x_{k} θ1x1+...+θkxk为点 x 1 , . . . , x k x_{1},...,x_{k} x1,...,xk的一个凸组合,其中 θ 1 + . . . + θ k = 1 \theta_{1}+...+\theta_{k}=1 θ1+...+θk=1。一个集合是凸集等价于集合包含其中所有点的凸组合
凸包:集合 C C C中所有凸组合的集合为其凸包:

c o n v   C = { θ 1 x 1 + . . . + θ k x k ∣ x i ∈ C , θ i > 0 , i = 1 , . . . , k , θ 1 + . . . + θ k = 1 } conv{\,}C=\{\theta_{1}x_{1}+...+\theta_{k}x_{k}|x_{i}\in C,\theta_{i}>0,i=1,...,k,\theta_{1}+...+\theta_{k}=1\} convC={θ1x1+...+θkxkxiC,θi>0,i=1,...,k,θ1+...+θk=1}

凸包总是凸的,它是包含 C C C的最小凸集

1.3 锥的概念

:如果对于任意 x ∈ C x \in C xC θ ≥ 0 \theta \geq 0 θ0都有 θ x ∈ C \theta x \in C θxC,则集合 C C C是锥或非负齐次
凸锥:如果几个 C C C是锥,并且是凸的,则它是凸锥
锥组合:具有 θ 1 x 1 + . . . + θ k x k ≥ 0 \theta_{1}x_{1}+...+\theta_{k}x_{k} \geq 0 θ1x1+...+θkxk0形式的点称为 x 1 , . . . , x k x_{1},...,x_{k} x1,...,xk的锥组合。集合 C C C是凸锥的重要条件是它包含其元素的所有锥组合
锥包:集合 C C C的锥包是 C C C中元素所有锥组合的集合,它是包含 C C C的最小凸锥

二、几种常见的凸集类型

2.1 超平面与半空间

超平面是具有下面形式的集合:

{ x ∣ a T x = b } \{x|a^{T}x=b\} {xaTx=b}

因此,超平面可看作是关于 x x x的线性方程的解空间,也是一个仿射集合
一个超平面把 R n R^{n} Rn划分为两个半空间。半空间可看作线性不等式的解空间:

{ x ∣ a T x ≤ b } \{x|a^{T}x \leq b\} {xaTxb}

半空间是凸的,但不是仿射的

2.2 Euclid球和椭球

Euclid球的公式表达如下:

B ( x c , r ) = { x ∣ ∣ ∣ x − x c ∣ ∣ 2 ≤ r } = { x ∣ ( x − x c ) T ( x − x c ) ≤ r 2 } \begin{aligned} B(x_{c},r)&=\{x|||x-x_{c}||_{2} \leq r\} \\ &=\{x|(x-x{c})^{T}(x-x_{c}) \leq r^{2}\} \end{aligned} B(xc,r)={xxxc2r}={x(xxc)T(xxc)r2}

它表示由距离球心 x c x_{c} xc距离不超过 r r r的所有点。Euclid球很容易证明是凸集,设有 ∣ ∣ x 1 − x c ∣ ∣ ≤ r , ∣ ∣ x 2 − x c ∣ ∣ ≤ r , 0 ≤ θ ≤ 1 ||x_{1}-x_{c}|| \leq r,||x_{2}-x_{c}|| \leq r, 0 \leq \theta \leq 1 x1xcr,x2xcr,0θ1,那么:

∣ ∣ θ x 1 + ( 1 − θ ) x 2 − x c ∣ ∣ 2 = ∣ ∣ θ ( x 1 − x c ) + ( 1 − θ ) ( x 2 − x c ) ∣ ∣ 2 ≤ θ ∣ ∣ x 1 − x c ∣ ∣ 2 + ( 1 − θ ) ∣ ∣ x 2 − x c ∣ ∣ 2 ≤ r \begin{aligned} ||\theta x_{1}+(1-\theta)x_{2}-x_{c}||_{2}&=||\theta(x_{1}-x_{c})+(1-\theta)(x_{2}-x_{c})||_{2} \\ & \leq \theta ||x_{1}-x_{c}||_{2}+(1-\theta)||x_{2}-x_{c}||_{2} \\ & \leq r \end{aligned} θx1+(1θ)x2xc2=θ(x1xc)+(1θ)(x2xc)2θx1xc2+(1θ)x2xc2r

与Euclid球相关的是椭球,形式如下:

ξ = { x ∣ ( x − x c ) T P − 1 ( x − x c ) ≤ 1 } \xi=\{x|(x-x_{c})^{T}P^{-1}(x-x_{c}) \leq 1\} ξ={x(xxc)TP1(xxc)1}

其中 P = P T P=P^{T} P=PT是对称正定矩阵,它决定了椭球从 x c x_{c} xc向各个方向扩展的幅度

2.3 范数球和范数锥

范数球的形式如下:

{ x ∣ ∣ ∣ x − x c ∣ ∣ ≤ r } \{x|||x-x_{c}|| \leq r\} {xxxcr}

范数球是凸的
范数锥是集合:

C = { ( x , t ) ∣ ∣ ∣ x ∣ ∣ ≤ t } ⊆ R n + 1 C=\{(x,t)|||x|| \leq t\} \subseteq R^{n+1} C={(x,t)xt}Rn+1

范数锥是凸锥

2.4 多面体

多面体是指有限个线性等式和不等式的解集:

P = { x ∣ a j T x ≤ b j , j = 1 , . . . , m , c j T x = d j , j = 1 , . . . , p } P=\{x|a_{j}^{T}x \leq b_{j},j=1,...,m,c_{j}^{T}x=d_{j},j=1,...,p\} P={xajTxbj,j=1,...,m,cjTx=dj,j=1,...,p}

多面体是有限个半空间和超平面的交集,是凸集,仿射集合、射线、线段和半空间都是多面体
单纯形是一类重要的多面体。设 k + 1 k+1 k+1个点 v 0 , . . . , v k ∈ R n v_{0},...,v_{k} \in R^{n} v0,...,vkRn仿射独立,也就是 v 1 − v 0 , . . . , v k − v 0 v_{1}-v_{0},...,v_{k}-v_{0} v1v0,...,vkv0线性独立,这些点决定了一个单纯形:

C = c o n v { v 0 , . . . , v k } = { θ 0 v 0 + . . . + θ k v k ∣ θ 0 + . . . + θ k = 1 , ∀ θ i ≥ 0 } \begin{aligned} C&=conv\{v_{0},...,v_{k}\} \\ &=\{\theta_{0}v_{0}+...+\theta_{k}v_{k}|\theta_{0}+...+\theta_{k}=1,\forall \theta_{i} \geq 0\} \end{aligned} C=conv{v0,...,vk}={θ0v0+...+θkvkθ0+...+θk=1,θi0}

这个单纯形的仿射维数是k,也叫做 R n R^{n} Rn空间的k维单纯形。一维单纯形是一条线段,二维单纯形是一个三角形,三维单纯形是一个四面体

2.5 半正定锥

首先用 S n S^{n} Sn表示堆成矩阵的集合:

S n = { X ∈ R n x n ∣ X = X T } S^{n}=\{X \in R^{nxn}|X=X^{T}\} Sn={XRnxnX=XT}

S + n S_{+}^{n} S+n表示对称半正定矩阵的集合:

S + n = { X ∈ S n ∣ X ≥ 0 } S_{+}^{n}=\{X \in S^{n}|X \geq 0\} S+n={XSnX0}

集合 S + n S_{+}^{n} S+n是一个凸锥:如果 θ 1 , θ 2 ≥ 0 \theta_{1},\theta_{2}\geq 0 θ1,θ20并且 A , B ∈ S + n A,B \in S_{+}^{n} A,BS+n,那么 θ 1 A + θ 2 B ∈ S + n \theta_{1}A+\theta_{2}B \in S_{+}^{n} θ1A+θ2BS+n


关注公众号:老刘聊广告,获取更多知识总结和广告领域前沿算法

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值