distance to convex cone

基本定义

定义1: 给定 1 ≤ K ≤ N 1 \leq K \leq N 1KN,定义凸锥(convex cone):
D = { x ∣ 1 T x = 0 , x 1 : N − K ≤ 0 , x ∈ R N } \mathrm{D} = \{ \boldsymbol x | \boldsymbol 1^T \boldsymbol x =0, x_{1: N-K} \leq 0, \boldsymbol x \in \mathbb R^N \} D={x1Tx=0,x1:NK0,xRN}

定义2: 若 g ∈ R N \boldsymbol g \in \mathbb R^N gRN是一个高斯向量,且 g ∼ N ( 0 , I N ) \boldsymbol g \sim \mathcal N(\boldsymbol 0, \boldsymbol I_N) gN(0,IN),定义 g \boldsymbol g g到凸锥 D \mathrm D D的映射为:
x = Π D ( g ) ,    g ∼ N ( 0 , I N ) \boldsymbol x = \Pi_{\mathrm D}(\boldsymbol g), \ \ \boldsymbol g \sim \mathcal N(\boldsymbol 0, \boldsymbol I_N) x=ΠD(g),  gN(0,IN)

其中 x ∈ R N \boldsymbol x \in \mathbb R^N xRN g \boldsymbol g g映射到 D \mathrm D D的向量。

定义3:凸锥 D \mathrm D D的统计维数(Statistical Dimension)可以定义为:
δ ( D ) = E [ ∥ Π D ( g ) ∥ 2 ] ,    g ∼ N ( 0 , I N ) \delta(\mathrm D) = \mathbb E \left [ \left \Vert \Pi_{\mathrm D}(\boldsymbol g) \right \Vert^2 \right], \ \ \boldsymbol g \sim \mathcal N(\boldsymbol 0, \boldsymbol I_N) δ(D)=E[ΠD(g)2],  gN(0,IN)

问题描述与建模:建模为凸优化问题

目标:给定 D \mathcal D D,计算得到统计维数(Statistical Dimension) δ ( D ) \delta(\mathrm D) δ(D)
问题:如果得到映射向量 x = Π D ( g ) \boldsymbol x = \Pi_{\mathrm D}(\boldsymbol g) x=ΠD(g)?
思路:通过建立以下优化问题

min ⁡ x ∈ D 1 2 ∥ x − g ∥ 2 \min_{\boldsymbol x \in \mathrm D} \frac{1}{2} \left \Vert \boldsymbol x - \boldsymbol g \right \Vert^2 xDmin21xg2

可以等价为

min ⁡ x 1 2 ∥ x − g ∥ 2 subject to x i ≤ 0 ,      i = 1 , ⋯   , N − K 1 T x = 0 \begin{aligned} & \min_{\boldsymbol x} \frac{1}{2} \left \Vert \boldsymbol x - \boldsymbol g \right \Vert^2 \\ \text{subject to} & \\ & x_i \leq 0, \ \ \ \ i = 1, \cdots, N-K \\ & \boldsymbol 1^T \boldsymbol x =0 \end{aligned} subject toxmin21xg2xi0,    i=1,,NK1Tx=0

亦可以等价为

min ⁡ x 1 2 ∥ x − g ∥ 2 subject to e i T x ≤ 0 ,      i = 1 , ⋯   , N − K 1 T x = 0 \begin{aligned} & \min_{\boldsymbol x} \frac{1}{2} \left \Vert \boldsymbol x - \boldsymbol g \right \Vert^2 \\ \text{subject to} & \\ & \boldsymbol e^T_i \boldsymbol x \leq 0, \ \ \ \ i = 1, \cdots, N-K \\ & \boldsymbol 1^T \boldsymbol x =0 \end{aligned} subject toxmin21xg2eiTx0,    i=1,,NK1Tx=0

上述问题是一个凸优化问题(满足强对偶性),我们可以借助拉格朗日方法进行求解。

优化问题求解

我们定义上述优化问题的拉格朗日函数,即 L : R N × R N − K × R → R L: \mathbb R^ N \times \mathbb R^{N-K} \times \mathbb R \rightarrow \mathbb R L:RN×RNK×RR
L ( x , λ , ν ) = 1 2 ∥ x − g ∥ 2 + ∑ i = 1 N − K λ i e i T x + ν 1 T x L(\boldsymbol x, \boldsymbol \lambda, \nu) = \frac{1}{2} \left \Vert \boldsymbol x - \boldsymbol g \right \Vert^2 + \sum_{i=1}^{N-K} \lambda_i \boldsymbol e^T_i \boldsymbol x + \nu \boldsymbol 1^T \boldsymbol x L(x,λ,ν)=21xg2+i=1NKλieiTx+ν1Tx

因为 L ( x , λ , ν ) L(\boldsymbol x, \boldsymbol \lambda, \nu) L(x,λ,ν)关于 x \boldsymbol x x是凸的,所以我们对 L L L求一阶导,得到
∇ x L = x − g + ∑ i = 1 N − K λ i e i + ν 1 \nabla_x L= \boldsymbol x -\boldsymbol g + \sum_{i=1}^{N-K} \lambda_i \boldsymbol e_i + \nu \boldsymbol 1 xL=xg+i=1NKλiei+ν1

因此,当 x = g − ∑ i = 1 N − K λ i e i − ν 1 \boldsymbol x = \boldsymbol g - \sum_{i=1}^{N-K} \lambda_i \boldsymbol e_i - \nu \boldsymbol 1 x=gi=1NKλieiν1 L L L可以取最小值,进一步可以得到对偶函数
h ( λ , ν ) = inf ⁡ x ∈ R N L ( x , λ , ν ) = L ( x , λ , ν ) ∣ x = g − ∑ i = 1 N − K λ i e i − ν 1 = 1 2 ∥ ∑ i = 1 N − K λ i e i + ν 1 ∥ 2 + ( ∑ i = 1 N − K λ i e i T ) ( g − ∑ i = 1 N − K λ i e i − ν 1 )        + ν 1 T ( g − ∑ i = 1 N − K λ i e i − ν 1 ) = 1 2 ( ∥ λ ∥ 2 + N ν 2 + 2 ν 1 T ( ∑ i = 1 N − K λ i e i ) ) + ( ∑ i = 1 N − K λ i e i T ) g − ∥ λ ∥ 2 − ν 1 T ( ∑ i = 1 N − K λ i e i )        + ν 1 T g − ν 1 T ( ∑ i = 1 N − K λ i e i ) − N ν 2 = − 1 2 ∥ λ ∥ 2 + ( ∑ i = 1 N − K λ i e i T ) g − 1 2 N ν 2 − ν 1 T ( ∑ i = 1 N − K λ i e i ) + ν 1 T g = − 1 2 ∥ λ ∥ 2 + ( ∑ i = 1 N − K λ i e i T ) g − 1 2 ν ( N ν + 2 ⋅ 1 T ( ∑ i = 1 N − K λ i e i ) − 2 ⋅ 1 T g ) \begin{aligned} h(\boldsymbol \lambda, \nu) &= \inf_{x \in \mathbb R^N} L(\boldsymbol x, \boldsymbol \lambda, \nu) \\ &= L(\boldsymbol x, \boldsymbol \lambda, \nu)|_{\boldsymbol x = \boldsymbol g - \sum_{i=1}^{N-K} \lambda_i \boldsymbol e_i - \nu \boldsymbol 1} \\ &= \frac{1}{2} \left \Vert \sum_{i=1}^{N-K} \lambda_i \boldsymbol e_i + \nu \boldsymbol 1 \right \Vert^2 + \left ( \sum_{i=1}^{N-K} \lambda_i \boldsymbol e^T_i \right) \left( \boldsymbol g - \sum_{i=1}^{N-K} \lambda_i \boldsymbol e_i - \nu \boldsymbol 1 \right) \\ & \ \ \ \ \ \ + \nu \boldsymbol 1^T \left( \boldsymbol g - \sum_{i=1}^{N-K} \lambda_i \boldsymbol e_i - \nu \boldsymbol 1 \right) \\ & = \frac{1}{2} \left( \Vert \boldsymbol \lambda \Vert^2 + N \nu^2 + 2 \nu \boldsymbol 1^T \left ( \sum_{i=1}^{N-K} \lambda_i \boldsymbol e_i \right) \right) + \left ( \sum_{i=1}^{N-K} \lambda_i \boldsymbol e^T_i \right) \boldsymbol g - \Vert \boldsymbol \lambda \Vert^2 - \nu \boldsymbol 1^T \left ( \sum_{i=1}^{N-K} \lambda_i \boldsymbol e_i \right) \\ & \ \ \ \ \ \ + \nu \boldsymbol 1^T \boldsymbol g - \nu \boldsymbol 1^T \left ( \sum_{i=1}^{N-K} \lambda_i \boldsymbol e_i \right) - N \nu^2 \\ &= -\frac{1}{2} \Vert \boldsymbol \lambda \Vert^2 + \left ( \sum_{i=1}^{N-K} \lambda_i \boldsymbol e^T_i \right) \boldsymbol g -\frac{1}{2}N \nu^2 - \nu \boldsymbol 1^T \left ( \sum_{i=1}^{N-K} \lambda_i \boldsymbol e_i \right) + \nu \boldsymbol 1^T \boldsymbol g \\ & = -\frac{1}{2} \Vert \boldsymbol \lambda \Vert^2 + \left ( \sum_{i=1}^{N-K} \lambda_i \boldsymbol e^T_i \right) \boldsymbol g - \frac{1}{2} \nu \left( N \nu + 2\cdot \boldsymbol 1^T \left ( \sum_{i=1}^{N-K} \lambda_i \boldsymbol e_i \right) - 2 \cdot \boldsymbol 1^T \boldsymbol g \right) \end{aligned} h(λ,ν)=xRNinfL(x,λ,ν)=L(x,λ,ν)x=gi=1NKλieiν1=21 i=1NKλiei+ν1 2+(i=1NKλieiT)(gi=1NKλieiν1)      +ν1T(gi=1NKλieiν1)=21(λ2+Nν2+2ν1T(i=1NKλiei))+(i=1NKλieiT)gλ2ν1T(i=1NKλiei)      +ν1Tgν1T(i=1NKλiei)Nν2=21λ2+(i=1NKλieiT)g21Nν2ν1T(i=1NKλiei)+ν1Tg=21λ2+(i=1NKλieiT)g21ν(Nν+21T(i=1NKλiei)21Tg)

又因为 1 T x = 0 \boldsymbol 1^T \boldsymbol x =0 1Tx=0,我们有
1 T ( g − ∑ i = 1 N − K λ i e i − ν 1 ) = 0 ⟹ N ν = 1 T g − 1 T ( ∑ i = 1 N − K λ i e i ) \begin{aligned} & \boldsymbol 1^T \left( \boldsymbol g - \sum_{i=1}^{N-K} \lambda_i \boldsymbol e_i - \nu \boldsymbol 1 \right) = 0 \\ \Longrightarrow & N \nu = \boldsymbol 1^T \boldsymbol g - \boldsymbol 1^T \left ( \sum_{i=1}^{N-K} \lambda_i \boldsymbol e_i \right) \end{aligned} 1T(gi=1NKλieiν1)=0Nν=1Tg1T(i=1NKλiei)

因此,对偶函数 h ( λ , ν ) h(\boldsymbol \lambda, \nu) h(λ,ν)可以继续化简为
h ( λ ) = − 1 2 ∥ λ ∥ 2 + ( ∑ i = 1 N − K λ i e i T ) g − 1 2 1 T g − 1 T ( ∑ i = 1 N − K λ i e i ) N ( 1 T ( ∑ i = 1 N − K λ i e i ) − 1 T g ) = − 1 2 ∥ λ ∥ 2 + ( ∑ i = 1 N − K λ i e i T ) g + 1 2 N ( 1 T ( ∑ i = 1 N − K λ i e i ) − 1 T g ) 2 = − 1 2 ∥ λ ∥ 2 + g 1 : N − K T λ + 1 2 N ( λ T 1 N − K − 1 N T g ) 2 = − 1 2 ∥ λ ∥ 2 + g 1 : N − K T λ + 1 2 N ( λ T 1 N − K 1 N − K T λ − 2 g T 1 N 1 N − K T λ + ∣ 1 N T g ∣ 2 ) = − 1 2 λ T ( I − 1 N 1 N − K 1 N − K T ) λ + ( g 1 : N − K T − g T 1 N 1 N 1 N − K T ) λ + 1 2 N ∣ 1 N T g ∣ 2 = − 1 2 λ T ( I − 1 N 1 N − K 1 N − K T ) λ + ( g 1 : N − K T ( I − 1 N 1 N − K 1 N − K T ) − g N − K + 1 : N T 1 N 1 K 1 N − K T ) λ        + 1 2 N ∣ 1 N T g ∣ 2 \begin{aligned} h(\boldsymbol \lambda) &= -\frac{1}{2} \Vert \boldsymbol \lambda \Vert^2 + \left ( \sum_{i=1}^{N-K} \lambda_i \boldsymbol e^T_i \right) \boldsymbol g - \frac{1}{2} \frac{ \boldsymbol 1^T \boldsymbol g - \boldsymbol 1^T \left ( \sum_{i=1}^{N-K} \lambda_i \boldsymbol e_i \right)}{N} \left( \boldsymbol 1^T \left ( \sum_{i=1}^{N-K} \lambda_i \boldsymbol e_i \right) - \boldsymbol 1^T \boldsymbol g \right) \\ &= -\frac{1}{2} \Vert \boldsymbol \lambda \Vert^2 + \left ( \sum_{i=1}^{N-K} \lambda_i \boldsymbol e^T_i \right) \boldsymbol g + \frac{1}{2N} \left( \boldsymbol 1^T \left ( \sum_{i=1}^{N-K} \lambda_i \boldsymbol e_i \right) - \boldsymbol 1^T \boldsymbol g \right)^2 \\ & = -\frac{1}{2} \Vert \boldsymbol \lambda \Vert^2 + \boldsymbol g_{1:N-K}^T \boldsymbol \lambda + \frac{1}{2N} \left( \boldsymbol \lambda^T \boldsymbol 1_{N-K} - \boldsymbol 1^T_N \boldsymbol g \right)^2 \\ &= -\frac{1}{2} \Vert \boldsymbol \lambda \Vert^2 + \boldsymbol g_{1:N-K}^T \boldsymbol \lambda + \frac{1}{2N} \left( \boldsymbol \lambda^T \boldsymbol 1_{N-K} \boldsymbol 1_{N-K}^T \boldsymbol \lambda - 2 \boldsymbol g^T \boldsymbol 1_N \boldsymbol 1^T_{N-K} \boldsymbol \lambda + |\boldsymbol 1^T_N \boldsymbol g|^2\right) \\ &= -\frac{1}{2} \boldsymbol \lambda^T \left( \boldsymbol I - \frac{1}{N} \boldsymbol 1_{N-K} \boldsymbol 1^T_{N-K} \right) \boldsymbol \lambda + \left( \boldsymbol g_{1:N-K}^T -\boldsymbol g^T \frac{1}{N} \boldsymbol 1_N \boldsymbol 1^T_{N-K} \right )\boldsymbol \lambda + \frac{1}{2N} |\boldsymbol 1^T_N \boldsymbol g|^2 \\ & = -\frac{1}{2} \boldsymbol \lambda^T \left( \boldsymbol I - \frac{1}{N} \boldsymbol 1_{N-K} \boldsymbol 1^T_{N-K} \right) \boldsymbol \lambda + \left( \boldsymbol g_{1:N-K}^T \left( \boldsymbol I - \frac{1}{N} \boldsymbol 1_{N-K} \boldsymbol 1^T_{N-K} \right) - \boldsymbol g_{N-K+1:N}^T \frac{1}{N} \boldsymbol 1_{K} \boldsymbol 1^T_{N-K} \right) \boldsymbol \lambda \\ & \ \ \ \ \ \ + \frac{1}{2N} |\boldsymbol 1^T_N \boldsymbol g|^2 \end{aligned} h(λ)=21λ2+(i=1NKλieiT)g21N1Tg1T(i=1NKλiei)(1T(i=1NKλiei)1Tg)=21λ2+(i=1NKλieiT)g+2N1(1T(i=1NKλiei)1Tg)2=21λ2+g1:NKTλ+2N1(λT1NK1NTg)2=21λ2+g1:NKTλ+2N1(λT1NK1NKTλ2gT1N1NKTλ+1NTg2)=21λT(IN11NK1NKT)λ+(g1:NKTgTN11N1NKT)λ+2N11NTg2=21λT(IN11NK1NKT)λ+(g1:NKT(IN11NK1NKT)gNK+1:NTN11K1NKT)λ      +2N11NTg2

B = I − 1 N 1 N − K 1 N − K T ∈ R ( N − K ) × ( N − K ) \boldsymbol B = \boldsymbol I - \frac{1}{N} \boldsymbol 1_{N-K} \boldsymbol 1^T_{N-K} \in \mathbb R^{(N-K) \times (N-K)} B=IN11NK1NKTR(NK)×(NK), C = 1 K 1 N − K T ∈ R K × ( N − K ) \boldsymbol C= \boldsymbol 1_{K} \boldsymbol 1^T_{N-K} \in \mathbb R^{K \times (N-K)} C=1K1NKTRK×(NK),则 h ( λ ) : R N − K → R h(\boldsymbol \lambda): \mathbb R^{N-K} \rightarrow \mathbb R h(λ):RNKR可以写为
h ( λ ) = − 1 2 λ T B λ + g 1 : N − K T B λ − 1 N g N − K + 1 : N T C λ + 1 2 N ∣ 1 N T g ∣ 2 \begin{aligned} h(\boldsymbol \lambda) &= -\frac{1}{2} \boldsymbol \lambda^T \boldsymbol B \boldsymbol \lambda + \boldsymbol g_{1:N-K}^T \boldsymbol B \boldsymbol \lambda - \frac{1}{N} \boldsymbol g_{N-K+1:N}^T \boldsymbol C \boldsymbol \lambda + \frac{1}{2N} |\boldsymbol 1^T_N \boldsymbol g|^2 \end{aligned} h(λ)=21λTBλ+g1:NKTBλN1gNK+1:NTCλ+2N11NTg2

最终,我们可以把对偶问题写为:

max ⁡ λ ∈ R N − K − 1 2 λ T B λ + g 1 : N − K T B λ − 1 N g N − K + 1 : N T C λ + 1 2 N ∣ 1 N T g ∣ 2 subject to λ ≥ 0 \begin{aligned} & \max_{\boldsymbol \lambda \in \mathbb R^{N-K}} -\frac{1}{2} \boldsymbol \lambda^T \boldsymbol B \boldsymbol \lambda + \boldsymbol g_{1:N-K}^T \boldsymbol B \boldsymbol \lambda - \frac{1}{N} \boldsymbol g_{N-K+1:N}^T \boldsymbol C \boldsymbol \lambda + \frac{1}{2N} |\boldsymbol 1^T_N \boldsymbol g|^2 \\ \text{subject to} & \\ & \boldsymbol \lambda \geq 0 \end{aligned} subject toλRNKmax21λTBλ+g1:NKTBλN1gNK+1:NTCλ+2N11NTg2λ0

进一步,我们分析矩阵 B \boldsymbol B B C \boldsymbol C C的相关性质。令 ϵ = K / N \epsilon = K/N ϵ=K/N q 1 = 1 N − K \boldsymbol q_1 = \frac{1}{\sqrt{N-K}} q1=NK 1 B \boldsymbol B B可以写为
B = I − 1 N 1 N − K 1 N − K T = I − ( 1 − ϵ ) q 1 q 1 T \begin{aligned} \boldsymbol B & = \boldsymbol I - \frac{1}{N} \boldsymbol 1_{N-K} \boldsymbol 1^T_{N-K} \\ &=\boldsymbol I - (1-\epsilon) \boldsymbol q_1 \boldsymbol q_1^T \end{aligned} B=IN11NK1NKT=I(1ϵ)q1q1T

  • B 2 = I − ( 1 − ϵ 2 ) q 1 q 1 T \boldsymbol B^{2} = \boldsymbol I - (1-{\epsilon}^2) \boldsymbol q_1 \boldsymbol q_1^T B2=I(1ϵ2)q1q1T
  • B − 1 = I − ( 1 − 1 ϵ ) q 1 q 1 T \boldsymbol B^{-1} = \boldsymbol I - (1-\frac{1}{\epsilon}) \boldsymbol q_1 \boldsymbol q_1^T B1=I(1ϵ1)q1q1T
  • B 1 2 = I − ( 1 − ϵ ) q 1 q 1 T \boldsymbol B^{\frac{1}{2}} = \boldsymbol I - (1-\sqrt{\epsilon}) \boldsymbol q_1 \boldsymbol q_1^T B21=I(1ϵ )q1q1T
  • B − 1 2 = I − ( 1 − 1 ϵ ) q 1 q 1 T \boldsymbol B^{-\frac{1}{2}} = \boldsymbol I - (1-\frac{1}{\sqrt{\epsilon}}) \boldsymbol q_1 \boldsymbol q_1^T B21=I(1ϵ 1)q1q1T

因为 C \boldsymbol C C是一个 K × ( N − K ) K \times (N-K) K×(NK)的全1矩阵,我们可以得到
B C T = ( 1 − ϵ ) C T B − 1 2 C T = ( 1 + 1 1 + 1 ϵ ) C T \begin{aligned} \boldsymbol {BC}^T = (1-\epsilon) \boldsymbol C^T \\ \boldsymbol B^{-\frac{1}{2}} \boldsymbol {C}^T = (1 + \frac{1}{1+ \frac{1}{\sqrt{ \epsilon}}}) \boldsymbol C^T \end{aligned} BCT=(1ϵ)CTB21CT=(1+1+ϵ 11)CT

尝试
∇ λ h = − B 1 2 λ + B g 1 : N − K − 1 N C T g N − K + 1 : N = − B 1 2 λ + [ B , − 1 N C T ] g \begin{aligned} \nabla_{\boldsymbol \lambda}h &= - \boldsymbol B^{\frac{1}{2}} \boldsymbol \lambda + \boldsymbol B \boldsymbol g_{1:N-K} - \frac{1}{N} \boldsymbol C^T \boldsymbol g_{N-K+1:N} \\ &= - \boldsymbol B^{\frac{1}{2}} \boldsymbol \lambda + \left[ \boldsymbol B, -\frac{1}{N} \boldsymbol C^T \right] \boldsymbol g \end{aligned} λh=B21λ+Bg1:NKN1CTgNK+1:N=B21λ+[B,N1CT]g

如果令 ∇ λ h = 0 \nabla_{\boldsymbol \lambda}h=0 λh=0,则
λ = B − 1 2 [ B , − 1 N C T ] g = [ B − 1 2 , − 1 N B − 1 2 C T ] g = [ B − 1 2 , − 1 N ( 1 + 1 1 + 1 ϵ ) C T ] g \begin{aligned} \boldsymbol \lambda &= \boldsymbol B^{-\frac{1}{2}} \left[ \boldsymbol B, -\frac{1}{N} \boldsymbol C^T \right] \boldsymbol g \\ &= \left[ \boldsymbol B^{-\frac{1}{2}}, -\frac{1}{N} \boldsymbol B^{-\frac{1}{2}} \boldsymbol C^T \right] \boldsymbol g \\ &= \left[ \boldsymbol B^{-\frac{1}{2}}, -\frac{1}{N}(1 + \frac{1}{1+ \frac{1}{\sqrt{ \epsilon}}}) \boldsymbol C^T \right] \boldsymbol g \end{aligned} λ=B21[B,N1CT]g=[B21,N1B21CT]g=[B21,N1(1+1+ϵ 11)CT]g

因为 g ∼ N ( 0 , I N ) \boldsymbol g \sim \mathcal N(\boldsymbol 0, \boldsymbol I_N) gN(0,IN),令 κ ( ϵ ) = ( 1 + 1 1 + 1 ϵ ) \kappa(\epsilon)=(1 + \frac{1}{1+ \frac{1}{\sqrt{ \epsilon}}}) κ(ϵ)=(1+1+ϵ 11),我们可以计算得到 λ \boldsymbol \lambda λ的协方差矩阵
Σ λ = [ B − 1 2 , − 1 N κ ( ϵ ) C T ] [ B − 1 2 , − 1 N κ ( ϵ ) C T ] T = B − 1 + 1 N 2 κ ( ϵ ) 2 C T C = B − 1 + 1 N 2 κ ( ϵ ) 2 1 N − K 1 K T 1 K 1 N − K T = B − 1 + κ ( ϵ ) 2 K ( N − K ) N 2 1 N − K ( N − K ) 1 N − K T ( N − K ) = B − 1 + κ ( ϵ ) 2 ϵ ( 1 − ϵ ) 1 N − K ( N − K ) 1 N − K T ( N − K ) = I N − K − ( 1 − 1 ϵ − ϵ ( 1 − ϵ ) κ 2 ( ϵ ) ) q 1 q 1 T \begin{aligned} \boldsymbol \Sigma_{\boldsymbol \lambda} &= \left[ \boldsymbol B^{-\frac{1}{2}}, -\frac{1}{N} \kappa(\epsilon) \boldsymbol C^T \right] \left[ \boldsymbol B^{-\frac{1}{2}}, -\frac{1}{N} \kappa(\epsilon) \boldsymbol C^T \right]^T \\ &= \boldsymbol B^{-1} + \frac{1}{N^2} \kappa(\epsilon)^2 \boldsymbol C^T \boldsymbol C \\ &= \boldsymbol B^{-1} + \frac{1}{N^2} \kappa(\epsilon)^2 \boldsymbol 1_{N-K} \boldsymbol 1_{K}^T \boldsymbol 1_{K} \boldsymbol 1^T_{N-K} \\ & = \boldsymbol B^{-1} + \kappa(\epsilon)^2 \frac{K(N-K)}{N^2} \frac{\boldsymbol 1_{N-K}}{\sqrt(N-K)} \frac{\boldsymbol 1^T_{N-K}}{\sqrt(N-K)} \\ & = \boldsymbol B^{-1} + \kappa(\epsilon)^2 \epsilon(1-\epsilon) \frac{\boldsymbol 1_{N-K}}{\sqrt(N-K)} \frac{\boldsymbol 1^T_{N-K}}{\sqrt(N-K)} \\ & = \boldsymbol I_{N-K} -\left( 1 - \frac{1}{\epsilon} - \epsilon (1- \epsilon ) \kappa^2(\epsilon) \right ) \boldsymbol q_1 \boldsymbol q^T_1 \end{aligned} Σλ=[B21,N1κ(ϵ)CT][B21,N1κ(ϵ)CT]T=B1+N21κ(ϵ)2CTC=B1+N21κ(ϵ)21NK1KT1K1NKT=B1+κ(ϵ)2N2K(NK)( NK)1NK( NK)1NKT=B1+κ(ϵ)2ϵ(1ϵ)( NK)1NK( NK)1NKT=INK(1ϵ1ϵ(1ϵ)κ2(ϵ))q1q1T

原问题:
min ⁡ x 1 2 ∥ x − g ∥ 2 subject to e i T x ≤ 0 ,      i = 1 , ⋯   , N − K 1 T x = 0 \begin{aligned} & \min_{\boldsymbol x} \frac{1}{2} \left \Vert \boldsymbol x - \boldsymbol g \right \Vert^2 \\ \text{subject to} & \\ & \boldsymbol e^T_i \boldsymbol x \leq 0, \ \ \ \ i = 1, \cdots, N-K \\ & \boldsymbol 1^T \boldsymbol x =0 \end{aligned} subject toxmin21xg2eiTx0,    i=1,,NK1Tx=0

对偶问题:
max ⁡ λ ∈ R N − K − 1 2 λ T B λ + g 1 : N − K T B λ − 1 N g N − K + 1 : N T C λ + 1 2 N ∣ 1 N T g ∣ 2 subject to λ ≥ 0 \begin{aligned} & \max_{\boldsymbol \lambda \in \mathbb R^{N-K}} -\frac{1}{2} \boldsymbol \lambda^T \boldsymbol B \boldsymbol \lambda + \boldsymbol g_{1:N-K}^T \boldsymbol B \boldsymbol \lambda - \frac{1}{N} \boldsymbol g_{N-K+1:N}^T \boldsymbol C \boldsymbol \lambda + \frac{1}{2N} |\boldsymbol 1^T_N \boldsymbol g|^2 \\ \text{subject to} & \\ & \boldsymbol \lambda \geq 0 \end{aligned} subject toλRNKmax21λTBλ+g1:NKTBλN1gNK+1:NTCλ+2N11NTg2λ0

  • 24
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 现代凸几何学是研究凸集、凸函数和凸组合等概念的数学分支。它在最优化理论、计算几何、算法设计等领域都有广泛应用。 凸集是一种具有很重要性质的几何对象。它是在任意两点间的线段上的点都属于该集合的非空子集。凸集有很多优良性质,例如,它们总是可加和可乘的。 而凸函数是一种具有强大性质的函数。它定义在凸集上,并满足对于该凸集内的任意两点,函数值的线段上的点也应在函数图像的下方。凸函数在经济学、物理学等多个学科中都有广泛应用,因为它们能帮助研究优化问题。 凸组合是凸几何中的另一个重要概念。它是指用给定点集中的点按一定权重线性组合所得到的点。对于给定的凸集合,凸组合的点总是在该凸集内。凸组合在图像和计算机图形学中非常有用,因为它们能够产生平滑的曲线和图像。 现代凸几何学不仅研究这些基本概念,还研究了它们的性质、性质之间的关系以及它们在不同领域的应用。这个学科的发展历史可以追溯到20世纪初。在过去的几十年里,它的理论和应用都取得了快速发展。在最优化问题中,凸几何学提供了强大的建模工具,帮助解决了许多实际问题。 总的来说,现代凸几何学是数学中一个发展迅速、应用广泛的学科。它的基本概念和性质在数学和其他科学领域中都起着重要作用,为解决实际问题提供了有力的工具和方法。 ### 回答2: 现代凸几何学可被视为一门研究凸集和凸函数性质的学科。凸集是指在集合内取任意两点的线段,该线段的所有点都在该集合内。凸函数是指定义在凸集上的函数,其满足任意两点间连线上的函数值小于等于函数在这两点处的凸组合值。现代凸几何学主要研究凸集和凸函数的性质与结构。 凸集的性质是凸几何学的核心内容之一。首先,凸集的交、并、凸组合仍然是凸集。也就是说,如果两个凸集相交,则它们的交集仍然是凸集;如果两个凸集并集,那么它们的并集仍然是凸集;对于任意凸集中的两个元素,它们的凸组合仍然在凸集内。其次,对于一个凸集,存在一个最小的凸集包含它,该凸集被称为凸包。凸包的性质十分重要,它是确定凸集的一种方式。 凸函数是凸几何学的另一个重要概念。凸函数具有许多良好的性质和结构。首先,凸函数的一阶导数是递增的。也就是说,凸函数在每个点上的导数都是非负的。其次,凸函数的二阶导数是非负的,也就是说,凸函数的二阶导数是凸函数。凸函数的这些性质使得它们在许多领域中有广泛的应用,如优化问题和经济学中的供求关系等。 另外,凸集和凸函数之间存在着密切的联系。凸函数的定义可通过凸集进行描述,即如果一个函数的定义域是凸集,并且该函数满足凸函数的定义,则该函数是凸函数。这种联系使得凸几何学和凸优化问题密不可分。凸优化问题是指在给定约束条件下寻找凸函数的最小值或最大值问题。凸几何学中关于凸集和凸函数性质的研究成果为解决凸优化问题提供了重要的理论和方法。 综上所述,现代凸几何学是研究凸集和凸函数性质的学科。凸集的性质包括交、并、凸组合等,而凸函数具有递增的一阶导数和非负的二阶导数等特点。凸集和凸函数之间有着密切的联系,使得凸几何学和凸优化问题相互依存、相互促进。 ### 回答3: 现代凸几何的初级介绍是一个介绍凸几何基本概念和结果的学科。凸几何是数学中的一个分支,研究平面和空间中凸集的性质和结构。凸集是包含任意两点之间的直线的集合。在凸几何中,我们探索凸集的性质,如凸包、支撑超平面、曲率等,并研究凸函数和凸优化。 在凸几何中,一个重要的概念是凸包。对于给定的点集,凸包是包含这些点的最小凸集。它可以用于解决各种问题,比如寻找最远点对、求解线性规划等。 另一个重要的概念是支撑超平面。对于一个凸集,存在着一组平行于某个方向的超平面,它们完全位于凸集中,并且至少有一个超平面与凸集相切。这些超平面被称为凸集的支撑超平面。它们在凸优化中扮演了重要的角色,被用于定义最优性条件。 凸几何还涉及到曲率的研究。曲率是描述曲线和曲面弯曲程度的概念。在凸几何中,我们研究了具有特定曲率性质的凸曲线和凸曲面。 最后,凸几何还与凸函数和凸优化密切相关。凸函数是一个定义在凸集上的实值函数,它在凸集内的两个点之间的连线上取值的所有点都位于函数曲线的下方。凸函数在优化问题中扮演了重要的角色,因为它们具有很好的最优性质。 总之,现代凸几何是一个研究凸集性质和结构、凸函数和凸优化的学科。它在各个领域都有广泛的应用,如数学、计算机科学、经济学等。对于进一步研究各种应用领域,了解凸几何的基本概念和结果至关重要。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值