定义
最近在研究WGAN,其中的Wasserstein distance的求解需要用到法卡斯定理,于是特意去了解了一下,也算是对线性代数知识的一个补充。
法卡斯定理如下:
∃
x
∈
R
n
,
A
x
=
b
a
n
d
x
≥
0
or
∃
y
∈
R
d
,
A
T
y
≤
0
a
n
d
b
T
y
>
0
\exists x \in R^n,Ax=b \ and \ x\ge0 \ \textbf{or} \ \exists y \in R^d, A^Ty \le 0 \ and \ b^Ty \gt 0
∃x∈Rn,Ax=b and x≥0 or ∃y∈Rd,ATy≤0 and bTy>0
其中,
A
∈
R
d
×
n
A \in R^{d\times n}
A∈Rd×n,
x
∈
R
n
x\in R^n
x∈Rn,
b
∈
R
d
b\in R^d
b∈Rd.
接下来我们将证明整个定理。
背景知识
在证明这个定理之前,我们先来了解几个概念。
-
凸集(Convex set)
在n维空间中,x与y的线段(line segment)定义如下:
x , y ∈ R n , [ x , y ] : = λ x + ( 1 − λ ) y ∣ λ ∈ [ 0 , 1 ] x,y\in R^n, [x,y]:={\lambda x+(1-\lambda)y| \lambda \in [0,1]} x,y∈Rn,[x,y]:=λx+(1−λ)y∣λ∈[0,1]凸集定义如下:
∀ x , y ∈ C , [ x , y ] ⊆ C , C ⊆ R n \forall x,y \in C, [x,y] \subseteq C, C \subseteq R^n ∀x,y∈C,[x,y]⊆C,C⊆Rn满足上述条件,则C为凸集。
图示如下:
上图中左图为凸集,右图不是凸集。 -
分离定理(Separation theorem)
A ⊆ R n , B ⊆ R n A\subseteq R^n,B\subseteq R^n A⊆Rn,B⊆Rn是不相交的非空凸集,存在一个非零向量v和实数c,使得 ⟨ x , v ⟩ ≥ c a n d ⟨ y , v ⟩ ≤ c \langle x,v \rangle \ge c \quad and \quad \langle y,v\rangle \le c ⟨x,v⟩≥cand⟨y,v⟩≤c
其中, x ∈ A , y ∈ B x\in A,y\in B x∈A,y∈B,超平面为 ⟨ ⋅ , v ⟩ = c \langle \cdot ,v\rangle =c ⟨⋅,v⟩=c,v是法向量。 -
凸锥(Convex Cone)
了解凸锥之前我们先来了解一下锥
对于向量空间V,C是V的子集,如果满足
∀ x ∈ C a n d α > 0 , α x ∈ C \forall x\in C\ and \ \alpha >0, \alpha x\in C ∀x∈C and α>0,αx∈C
那么C是锥。
对于锥C,如果满足
∀ x , y ∈ C a n d α , β ≥ 0 , α x + β y ∈ C \forall x,y\in C\ and\ \alpha,\beta \ge 0, \alpha x+\beta y \in C ∀x,y∈C and α,β≥0,αx+βy∈C
那么C是凸锥。
证明
给定矩阵
A
⊆
R
d
×
n
A\subseteq R^{d\times n}
A⊆Rd×n,我们将其看作n个向量
a
1
,
.
.
.
,
a
n
∈
R
d
a_1,...,a_n\in R^d
a1,...,an∈Rd,给定
x
∈
R
n
(
x
>
0
)
x\in R^n(x>0)
x∈Rn(x>0), 于是我们得到了一个凸锥
A
x
,
∀
x
>
0
Ax,\forall x\gt 0
Ax,∀x>0
对于一个向量
b
∈
R
d
b\in R^d
b∈Rd,有两种可能,b在上述的凸锥中;b不在上述凸锥中。如果b不再凸锥中,那么我们可以找到一个经过原点的超平面h,h位于b和凸锥之间,h的法向量为
y
∈
R
d
y\in R^d
y∈Rd。b和y处于h的同侧,而凸锥则在h的另一侧,那么我们有
b
T
y
>
0
b^Ty\gt0
bTy>0,同时,
a
i
T
y
<
0
a_i^Ty\lt 0
aiTy<0.
总结以上两种情况,
- ∃ x ∈ R n , A x = b a n d x ≥ 0 \exists x \in R^n,Ax=b \ and \ x\ge0 ∃x∈Rn,Ax=b and x≥0
- ∃ y ∈ R d , A T y ≤ 0 a n d b T y > 0 \exists y \in R^d, A^Ty \le 0 \ and \ b^Ty \gt 0 ∃y∈Rd,ATy≤0 and bTy>0
参考资料