文章目录
1. 前置知识
1.1. 内积空间
X是实向量空间,X上的内积是指函数
(
⋅
,
⋅
)
:
X
×
X
→
R
(\cdot,\cdot):X\times X\to \mathbb{R}
(⋅,⋅):X×X→R ,它满足对任何
x
,
y
,
z
∈
X
x,y,z\in X
x,y,z∈X 和任何
α
,
β
∈
R
\alpha,\beta\in \mathbb{R}
α,β∈R 有
(
α
x
+
β
y
,
z
)
=
α
(
x
,
z
)
+
β
(
y
,
z
)
(\alpha x+ \beta y,z) = \alpha(x,z) + \beta(y,z)
(αx+βy,z)=α(x,z)+β(y,z)
(
x
,
α
y
+
β
z
)
=
α
(
x
,
y
)
+
β
(
x
,
z
)
(x,\alpha y + \beta z) = \alpha(x,y) + \beta(x,z)
(x,αy+βz)=α(x,y)+β(x,z)
(
x
,
y
)
=
(
y
,
x
)
(x,y) = (y,x)
(x,y)=(y,x)
(
x
,
x
)
≥
0
,
当
且
仅
当
x
=
0
时
(
x
,
x
)
=
0
(x,x)\ge 0 , 当且仅当 x=0 时 (x,x) = 0
(x,x)≥0,当且仅当x=0时(x,x)=0
也就是说,线性、对称、正定。
如果是复向量空间的话,应有 ( x , y ) = ( y , x ) ‾ (x,y) = \overline{(y,x)} (x,y)=(y,x)
1.1.1. 一些性质
柯西不等式成立
∣
(
x
,
y
)
∣
≤
(
x
,
x
)
(
y
,
y
)
|(x,y)|\le \sqrt{(x,x)}\sqrt{(y,y)}
∣(x,y)∣≤(x,x)(y,y)
平行四边形法则
(
X
,
(
⋅
,
⋅
)
)
(X,(\cdot,\cdot))
(X,(⋅,⋅)) 为内积空间,对任何
x
,
y
∈
X
x,y\in X
x,y∈X ,有
∣
∣
x
+
y
∣
∣
2
+
∣
∣
x
−
y
∣
∣
2
=
2
∣
∣
x
∣
∣
2
+
2
∣
∣
y
∣
∣
2
||x+y||^2+||x-y||^2=2||x||^2+2||y||^2
∣∣x+y∣∣2+∣∣x−y∣∣2=2∣∣x∣∣2+2∣∣y∣∣2
由此可得内积空间是一致凸的。
(啊这。。。对角线的范数和等于边长的范数和)
1.2. 希尔伯特空间 Hilbert Space
内积空间 ( X , ( ⋅ , ⋅ ) ) (X,(\cdot,\cdot)) (X,(⋅,⋅)) 被称为Hilbert空间,是指其作为赋范向量空间是一个 Banach空间,即X关于由 ∣ ∣ x ∣ ∣ = ( x , x ) , x ∈ X ||x|| = \sqrt{(x,x)},x\in X ∣∣x∣∣=(x,x),x∈X 定义的范数 ∣ ∣ ⋅ ∣ ∣ ||\cdot|| ∣∣⋅∣∣ 是完备的。希尔伯特空间是欧几里德空间的直接推广。
1.2.1. 投影算子
P
:
=
I
−
a
a
T
P:=I-aa^T
P:=I−aaT 是X到Z上的投影算子,有
∀
x
∈
R
n
,
a
T
P
x
=
a
T
x
−
a
T
a
a
T
x
=
0
\forall x\in \mathbb{R}^n,a^TPx = a^Tx - a^Taa^Tx = 0
∀x∈Rn,aTPx=aTx−aTaaTx=0
∀
z
∈
Z
,
(
P
x
−
z
)
T
z
=
−
x
T
a
a
T
z
=
0
\forall z\in Z,(Px-z)^Tz = -x^Taa^Tz = 0
∀z∈Z,(Px−z)Tz=−xTaaTz=0
也就是可以投影到以a为法向量的超平面上。
2. 线性系统的最小二乘解
对任意的 m × n m\times n m×n 实矩阵A和任意向量 c ∈ R m c\in \mathbb{R}^m c∈Rm ,一般并不存在向量 x ∈ R n x\in\mathbb{R}^n x∈Rn 使得 A x = c Ax=c Ax=c ,因此往往一般求线性系统的最小二乘解(高中应该都学过最小二乘法拟合直线),即寻求向量 x ∈ R n x\in\mathbb{R}^n x∈Rn ,使得 R m \mathbb{R}^m Rm 中的向量 A x Ax Ax 和 c c c 的欧式(Euclid)距离最短。
设 ∣ ∣ ⋅ ∣ ∣ ||\cdot|| ∣∣⋅∣∣ 为 R m \mathbb{R}^m Rm 中的Euclid范数,有
- 给定
m
×
n
m\times n
m×n 阵A和向量
c
∈
R
m
c\in\mathbb{R}^m
c∈Rm ,最小化问题,即求向量
x
∈
R
n
x\in\mathbb{R}^n
x∈Rn 使得
∣ ∣ A x − c ∣ ∣ = i n f y ∈ R n ∣ ∣ A y − c ∣ ∣ ||Ax-c||=\mathop{inf}\limits_{y\in\mathbb{R}^n} ||Ay-c|| ∣∣Ax−c∣∣=y∈Rninf∣∣Ay−c∣∣
至少有一个解。 (这说明了我们只要拿到方程,肯定能找到一个欧氏距离的下界对应的x。为啥是至少呢?因为可能有多个解都取到欧氏距离的下界吧,用哪个都行。) - 向量
x
∈
R
n
x\in\mathbb{R}^n
x∈Rn 满足上述最小化问题当且仅当x是下述线性系统
A T A x = A T c A^TAx = A^Tc ATAx=ATc
的解。
这就需要投影定理来证明了。首先 R m \mathbb R^m Rm 的闭子空间意味着存在唯一的向量 ∣ ∣ x ~ − c ∣ ∣ = i n f y ~ ∈ I m A ∣ ∣ y ~ − c ∣ ∣ ||\tilde{x}-c|| = \mathop{inf}\limits_{\tilde{y} \in Im ~ A}||\tilde{y} - c|| ∣∣x~−c∣∣=y~∈Im Ainf∣∣y~−c∣∣
这个时候
x
~
\tilde{x}
x~ 就是 c在
I
m
A
Im A
ImA 中的投影,他们的差垂直于这个超平面。
(想象一下咱们日常投影的话就是到这个屏幕作垂线然后连接到线和平面的交点嘛)
所以他们的内积为0
因此有对任意的
y
~
∈
I
m
A
\tilde{y} \in Im~ A
y~∈Im A ,
(
x
~
−
c
,
y
~
)
m
=
0
(\tilde{x}-c,\tilde{y})_m = 0
(x~−c,y~)m=0
其中 ( ⋅ , ⋅ ) m (\cdot,\cdot)_m (⋅,⋅)m 表示 R m \mathbb{R}^m Rm 中的Euclid内积。
因此有
∣
∣
A
x
−
c
∣
∣
=
i
n
f
y
∈
R
n
∣
∣
A
y
−
c
∣
∣
||Ax-c||=\mathop{inf}\limits_{y\in\mathbb{R}^n} ||Ay-c||
∣∣Ax−c∣∣=y∈Rninf∣∣Ay−c∣∣
用内积为0来计算一下,有(利用一下欧式内积 ( x , y ) = y T x (x,y) = y^Tx (x,y)=yTx ,感谢我还没把殷老师的数学课忘完)
(
A
x
−
c
,
A
y
)
m
=
(
y
T
A
T
A
x
−
y
T
A
T
c
)
m
=
(
A
T
A
x
−
A
T
c
,
y
)
n
=
0
(Ax-c,Ay)_m = (y^TA^TAx - y^TA^Tc)_m =(A^TAx-A^Tc,y)_n =0
(Ax−c,Ay)m=(yTATAx−yTATc)m=(ATAx−ATc,y)n=0
因此
A
T
A
x
=
A
T
c
A^TAx = A^Tc
ATAx=ATc
3. 直和定理
3.1. 直交
直交就是正交,就是在内积空间上两个向量满足内积为0 ( x , y ) = 0 (x,y) = 0 (x,y)=0
X的任何非空子集Z的直交补定义为 X 的子集
Z
⊥
:
=
{
x
∈
X
;
∀
z
∈
Z
,
(
x
,
z
)
=
0
}
Z^{\perp}:= \{x\in X; \forall z\in Z,(x,z) = 0\}
Z⊥:={x∈X;∀z∈Z,(x,z)=0}
直交补就是和这个集合里面的所有元素都正交的元素组成的集合。
3.2. 直和定理
设X为实或复的Hilbert空间,Y是X的闭子空间,X可以表示为直和
X
=
Y
⊕
Y
⊥
X=Y \oplus Y^{\perp}
X=Y⊕Y⊥
这里的这个
⊕
\oplus
⊕ 是半价运算,就是取两个集合里面只存在一个集合的元素,都有或都没有的都不取。(就是异或嘛)
所以 ∀ x ∈ X , x = y + y ⊥ \forall x\in X , x= y+y^{\perp} ∀x∈X,x=y+y⊥ (啊这样的分解是唯一的)
- 简单的证明:
存在性:
取
y
=
P
x
,
y
∈
Y
,
y
⊥
=
(
I
−
P
)
x
y = Px,y\in Y,y^{\perp} = (I-P)x
y=Px,y∈Y,y⊥=(I−P)x ,显然有
y
+
y
⊥
=
x
y+y^{\perp} = x
y+y⊥=x
(
y
⊥
,
x
)
=
(
x
,
x
)
−
(
P
x
,
x
)
=
0
,
y
⊥
∈
Y
⊥
(y^{\perp},x) = (x,x) - (Px,x) = 0,y^{\perp}\in Y^{\perp}
(y⊥,x)=(x,x)−(Px,x)=0,y⊥∈Y⊥
唯一性:
设
x
=
y
+
y
⊥
=
y
^
+
y
^
⊥
x = y+y^{\perp}=\hat y +\hat y^{\perp}
x=y+y⊥=y^+y^⊥
( y − y ⊥ ) ∈ Y , ( y ^ − y ^ ⊥ ) ∈ Y ⊥ (y - y^{\perp})\in Y,(\hat{y} - \hat y^{\perp})\in Y^{\perp} (y−y⊥)∈Y,(y^−y^⊥)∈Y⊥ 又有 Y ∩ Y ⊥ = { 0 } Y\cap Y^{\perp} = \{0\} Y∩Y⊥={0}
所以 y − y ^ = y ⊥ − y ^ ⊥ = 0 y-\hat y=y^{\perp}-\hat y^{\perp}=0 y−y^=y⊥−y^⊥=0
- 投影算子
∀ x ∈ X , ∵ P x ∈ Y , ∀ y ⊥ ∈ Y ⊥ \forall x\in X, \because Px\in Y, \forall y^{\perp}\in Y^{\perp} ∀x∈X,∵Px∈Y,∀y⊥∈Y⊥ 有
( x − P ⊥ x , y ⊥ ) = ( P x , y ⊥ ) = 0 (x-P^{\perp}x,y^{\perp})=(Px,y^{\perp}) = 0 (x−P⊥x,y⊥)=(Px,y⊥)=0
因此 P ⊥ : = I − P P^{\perp} := I-P P⊥:=I−P 是X到子空间 Y ⊥ Y^{\perp} Y⊥ 上的投影算子。