第1章 线性空间
线性代数主要研究有限维向量空间上的线性映射。
§1.1 复数
一个复数(complex number)就是一个有序的数对(a,b),其中
a
,
b
∈
R
a,b \in R
a,b∈R记为:
C
=
{
a
+
b
i
:
a
,
b
∈
R
}
C = \{a+bi : a,b \in R\}
C={a+bi:a,b∈R}
使用 F 代表 C 或 R 。F 中的元素称为标量(scalar)。
§1.2 向量空间的定义
向量空间
R
2
R^2
R2可以看作通常的空间,它由所有有序对构成:
R
2
=
{
(
x
,
y
)
:
x
,
y
∈
R
}
R^2 = \{(x, y): x, y \in R\}
R2={(x,y):x,y∈R}
长度(length)为 n 的组(list)记做
(
x
1
,
.
.
.
,
x
n
)
(x_1,...,x_n)
(x1,...,xn)。
x
j
x_j
xj为第j个坐标。
两个组相同当且仅当长度和对应坐标相等。
组与集合的区别:有序并且可重复。
对于n≥4的R或n≥2的C,人类大脑不能产生对应的几何模型。
F
n
F^n
Fn上的加法和标量乘法通过分配率联系到一起。这是唯一的将加法和数乘联系起来的性质。
向量空间(vector space)就是带有加法和标量乘法的集合V,满足:
交换性
结合性
加法单位元
乘法单位元
分配性
F
n
F^n
Fn是F上的向量空间。
F
∞
=
{
(
x
1
,
x
2
,
.
.
.
)
:
x
j
∈
F
,
j
=
1
,
2
,
.
.
.
}
F^\infin = \{(x_1, x_2, ...):x_j \in F, j = 1, 2, ...\}
F∞={(x1,x2,...):xj∈F,j=1,2,...}
一个函数
p
:
F
→
F
p:F \rightarrow F
p:F→F称为系数在F中的多项式(polynomial),如果存在
a
0
,
.
.
.
,
a
m
∈
F
a_0, ..., a_m \in F
a0,...,am∈F使得
p
(
z
)
=
a
0
+
a
1
z
+
a
2
z
2
+
.
.
.
+
a
m
z
m
,
z
∈
F
.
p(z) = a_0 + a_1z + a_2z^2 + ... + a_mz^m, z\in F.
p(z)=a0+a1z+a2z2+...+amzm,z∈F.
P ( F ) P(F) P(F)为系数在F中的所有多项式构成的集合。 P ( F ) P(F) P(F)是向量空间。
§1.3 向量空间的性质
1.2 命题:向量空间有唯一的加法单位元。
1.3 命题:向量空间中的每个元素都有唯一的加法逆。
1.4 命题:对每个
v
∈
V
v \in V
v∈V都有
0
v
=
0
⃗
0v = \vec0
0v=0。
1.5 命题:对每个
a
∈
F
a \in F
a∈F都有
a
0
⃗
=
0
⃗
a\vec0 = \vec0
a0=0。
1.6 命题:对每个
v
∈
V
v \in V
v∈V都有
(
−
1
)
v
=
−
v
(-1)v = -v
(−1)v=−v。
§1.4 子空间
V的子集U称为V的子空间(subspace),如果U也是向量空间。
U的子集V是子空间的充要条件:
有加法单位元
对加法封闭
对标量乘法封闭
R 2 R^2 R2的子空间恰好为{0}, R 2 R^2 R2, R 2 R^2 R2中所有过原点的直线。 R 3 R^3 R3的子空间恰好为{0}, R 3 R^3 R3, R 3 R^3 R3中所有过原点的直线, R 3 R^3 R3中所有过原点的平面。
§1.5 直和
设
U
1
,
.
.
.
,
U
m
U_1,...,U_m
U1,...,Um都是 V 的子空间,
U
1
,
.
.
.
,
U
m
U_1,...,U_m
U1,...,Um的和(sum)记为
U
1
+
.
.
.
+
U
m
U_1+...+U_m
U1+...+Um,定义为
U
1
,
.
.
.
,
U
m
U_1,...,U_m
U1,...,Um中元素所有可能的和所构成的集合。
U
1
+
.
.
.
+
U
m
=
{
u
1
+
.
.
.
+
u
m
:
u
1
∈
U
1
,
.
.
.
,
u
m
∈
U
m
}
U_1+...+U_m = \{u_1+...+u_m : u1 \in U_1, ..., u_m \in U_m\}
U1+...+Um={u1+...+um:u1∈U1,...,um∈Um}
U
1
+
.
.
.
+
U
m
U_1+...+U_m
U1+...+Um是 包含
U
1
,
.
.
.
,
U
m
U_1,...,U_m
U1,...,Um 的最小子空间。
如果V的每个元素都可以唯一地写成
u
1
+
.
.
.
+
u
m
u_1+...+u_m
u1+...+um,其中
u
j
∈
U
j
u_j \in U_j
uj∈Uj,则成V是子空间
U
1
,
.
.
.
,
U
m
U_1,...,U_m
U1,...,Um 的直和(direct sum)。记为
U
1
⊕
.
.
.
⊕
U
m
U_1\oplus...\oplus U_m
U1⊕...⊕Um。
通过
0
⃗
\vec0
0表示成向量的和时是否唯一来判断是不是直和。
1.8 命题:设
U
1
,
.
.
.
,
U
n
U_1,...,U_n
U1,...,Un都是V的子空间,则
V
=
U
1
⊕
.
.
.
⊕
U
n
V = U_1\oplus...\oplus U_n
V=U1⊕...⊕Un 当且仅当下列两个条件成立:
(a) V = U 1 + . . . + U m V = U_1 + ... + U_m V=U1+...+Um
(b) 若 0 = u 1 + . . . + u n , u j ∈ U J 0 = u_1 + ... + u_n, u_j \in U_J 0=u1+...+un,uj∈UJ 则每个 u j u_j uj 都为 0 ⃗ \vec0 0.
1.9 命题:设 U 和 W 都是 V 的子空间,则 V = U ⊕ W V = U \oplus W V=U⊕W 当且仅当 V = U + W V = U + W V=U+W,并且 U ∩ W = { 0 } U \cap W = \{0\} U∩W={0}。
第2章 有限维向量空间
§2.1 张成与线性无关
V 中一组向量
(
v
1
,
.
.
.
v
m
)
(v_1, ... v_m)
(v1,...vm) 的**线性组合(linear combination)**是如下形式的向量
a
1
v
1
+
.
.
.
+
a
m
v
m
a_1v_1 + ... + a_mv_m
a1v1+...+amvm
其中
a
1
,
.
.
.
,
a
m
∈
F
a_1, ..., a_m \in F
a1,...,am∈F。
(
v
1
,
.
.
.
v
m
)
(v_1, ... v_m)
(v1,...vm) 的所有线性组合所构成的集合称为
(
v
1
,
.
.
.
v
m
)
(v_1, ... v_m)
(v1,...vm) 的张成(span),记为
s
p
a
n
(
v
1
,
.
.
.
v
m
)
span(v_1, ... v_m)
span(v1,...vm)。也就是说
s
p
a
n
(
v
1
,
.
.
.
v
m
)
=
{
a
1
v
1
+
.
.
.
+
a
m
v
m
:
a
1
,
.
.
.
,
a
m
∈
F
}
span(v_1, ... v_m) = \{a_1v_1 + ... + a_mv_m:a_1, ..., a_m \in F\}
span(v1,...vm)={a1v1+...+amvm:a1,...,am∈F}
V 的任意一组向量张成都是 V 的子空间,且是包含这组向量的最小子空间。为了一致性,空组()的张成等于{0}。
如果
s
p
a
n
(
v
1
,
.
.
.
v
m
)
span(v_1, ... v_m)
span(v1,...vm) 等于 V,则称
(
v
1
,
.
.
.
v
m
)
(v_1, ... v_m)
(v1,...vm) 张成(span) V。如果一个向量空间可以由它的一组向量张成,则称其为有限维的(finite dimensional)。
p
(
z
)
=
a
0
+
a
1
z
+
.
.
.
+
a
m
z
m
,
z
∈
F
p(z) = a_0 + a_1z + ... + a_mz^m,z \in F
p(z)=a0+a1z+...+amzm,z∈F
则说 p 的**次数(degree)**为 m。规定恒等于 0 的多项式的次数为 − ∞ -\infty −∞。
一个向量空间不是有限维的就是无限维的(infinite dimensional)。无限维的向量空间是泛函分析(function analysis) 的数学分支所关心的核心内容。
对于V中的一组向量 ( v 1 , . . . v m ) (v_1,...v_m) (v1,...vm),如果使得 a 1 v 1 + . . . + a m v m a_1v_1 + ... + a_mv_m a1v1+...+amvm等于0的 a 1 , . . . , a m ∈ F a_1, ..., a_m \in F a1,...,am∈F 只有 a 1 = . . . a m = 0 a_1 = ... a_m = 0 a1=...am=0 ,则称 ( v 1 , . . . v m ) (v_1,...v_m) (v1,...vm) 是线性无关的(linearly independent)。V 中的一组向量如果不是线性无关的,则称为线性相关的(linearly dependent)。任意包含 0 0 0 向量的向量组欧式线性相关的。
线性相关性引理(Linear Dependent Lemma):如果 ( v 1 , . . . , v m ) (v_1, ..., v_m) (v1,...,vm) 在 V 中是线性相关的,并且 v 1 ≠ 0 v_1 \neq 0 v1̸=0,则有 j ∈ { 2 , . . . , m } j \in \{2, ..., m\} j∈{2,...,m} 使得下列成立:
- (a) v j ∈ s p a n ( v 1 , . . . , v j − 1 ) v_j \in span(v_1, ..., v_{j-1}) vj∈span(v1,...,vj−1);
- (b) 如果从 ( v 1 , . . . , v m ) (v_1, ..., v_m) (v1,...,vm) 中去掉第 j 项,则剩余组的张成等于 s p a n ( v 1 , . . . , v m ) span(v_1, ..., v_m) span(v1,...,vm)。
定理:在有限维向量空间中,线性无关向量组的长度小于或等于张成向量组的长度。
§2.2 基
若 V 中的一个向量组即使线性无关的又张成 V,则称之为 V 的基(base)。((1,0,…,0),(0,1,…,0),…,(0,0,…,1))是 F n F^n Fn 的一个基,称为 F n F^n Fn 的基准基(standard basis)。
命题:V 中向量组
(
v
1
,
.
.
.
,
v
m
)
(v_1, ..., v_m)
(v1,...,vm) 是 V的基当且仅当每个
v
∈
V
v \in V
v∈V 都能唯一地写成如下形式
v
=
a
1
v
1
+
.
.
.
+
a
n
v
n
v = a_1v_1 + ... + a_nv_n
v=a1v1+...+anvn
其中 a 1 , . . . , a n ∈ F a_1, ..., a_n \in F a1,...,an∈F。
定理:在向量空间中,每个张成组都可以化简成一个基。
推论:每个有限维向量空间都有基。
定理:在有限维向量空间中,每个线性无关向量组都可以扩充成一个基。
命题:设 V 是有限维的,U 是 V 的一个子空间,则存在 V 的一个子空间 W使得
V
=
U
⊕
W
V = U \oplus W
V=U⊕W。
§2.3 维数
定理:有限维向量空间的任意两个基的长度都相同。
有限维向量空间的任意基的长度称为这个向量空间的维度(dimension),记为
d
i
m
V
dim V
dimV。例如
d
i
m
F
n
=
n
,
d
i
m
P
m
(
F
)
=
m
+
1
dim F^n = n,dim P_m(F) = m+1
dimFn=n,dimPm(F)=m+1。
命题:若 V 是有限维的,且 U 是 V 的子空间,则
d
i
m
U
≤
d
i
m
V
dim U \le dim V
dimU≤dimV。
命题:若 V 是有限维的,则 V 中每个长度为
d
i
m
V
dim V
dimV 的张成向量组都是 V 的一个基。
命题:若 V 是有限维的,则 V 中每个长度为
d
i
m
V
dim V
dimV 的线性无关向量组都是 V 的基。
定理:如果
U
1
U_1
U1 和
U
2
U_2
U2 是同一个有限维向量空间的两个子空间,那么
d
i
m
(
U
1
+
U
2
)
=
d
i
m
U
1
+
d
i
m
U
2
−
d
i
m
(
U
1
∩
U
2
)
。
dim(U_1 + U_2) = dim U_1 + dim U_2 - dim(U_1 \cap U_2)。
dim(U1+U2)=dimU1+dimU2−dim(U1∩U2)。
命题:若 V 是有限维的,且
U
1
,
.
.
.
,
U
m
U_1, ..., U_m
U1,...,Um 是 V 的线性子空间,使得
V
=
U
1
+
.
.
.
+
U
m
V = U_1 + ... + U_m
V=U1+...+Um
且
d
i
m
V
=
d
i
m
U
1
+
.
.
.
+
d
i
m
U
m
dim V = dim U_1 + ... + dim U_m
dimV=dimU1+...+dimUm
则
V
=
U
1
⊕
.
.
.
⊕
U
m
V = U_1 \oplus ... \oplus U_m
V=U1⊕...⊕Um。
第3章 线性映射
§3.1 定义与例子
从 V 到 W 的线性映射(linear map) 是具有下列性质的函数
T
:
V
→
W
T: V \rightarrow W
T:V→W:
加性(addivity):对所有
u
,
v
∈
V
u, v \in V
u,v∈V 都有
T
(
u
+
v
)
=
T
u
+
T
v
T(u+v) = Tu + Tv
T(u+v)=Tu+Tv;
齐性(homogeneity):对所有
a
∈
F
,
v
∈
V
a \in F, v \in V
a∈F,v∈V 都有
T
(
a
v
)
=
a
T
(
v
)
T(av) = aT(v)
T(av)=aT(v).
从 V 到 W 的所有的线性映射的集合记为 L ( V , W ) L(V, W) L(V,W)
线性映射举例:
零(zero): 0 ∈ L ( V , W ) , 0 v = 0 0 \in L(V, W), 0v = 0 0∈L(V,W),0v=0
恒等(identity): I ∈ L ( V , W ) , I v = v I \in L(V, W), Iv = v I∈L(V,W),Iv=v
微分(differentiation): T ∈ L ( P ( R ) , P ( R ) ) , T p = p ′ T \in L(P(R), P(R)), Tp = p^{'} T∈L(P(R),P(R)),Tp=p′
积分(integration): T ∈ L ( P ( R ) , R ) , T p = ∫ 0 1 p ( x ) d x T \in L(P(R), R), Tp = \int_{0}^{1} p(x)dx T∈L(P(R),R),Tp=∫01p(x)dx
x 2 x^2 x2 乘(multiplication by x 2 x^2 x2): T ∈ L ( P ( R ) , P ( R ) ) , ( T p ) ( x ) = x 2 p ( x ) , x ∈ R T \in L(P(R), P(R)), (Tp)(x) = x^2p(x), x \in R T∈L(P(R),P(R)),(Tp)(x)=x2p(x),x∈R
后移位(backward shift): T ∈ L ( F ∞ , F ∞ ) , T ( x 1 , x 2 , x 3 , . . . ) = T ( x 2 , x 3 , . . . ) T \in L(F^\infty, F^\infty), T(x_1, x_2, x_3, ...) = T(x_2, x_3, ...) T∈L(F∞,F∞),T(x1,x2,x3,...)=T(x2,x3,...)
从 F n F^n Fn 到 F m F^m Fm (from F n F^n Fn to F m F^m Fm): T ∈ L ( F n , F m ) , T ( x , y , z ) = ( 2 x − y + 3 z , 7 x + 5 y − 6 z ) T \in L(F^n, F^m), T(x, y, z) = (2x-y+3z, 7x+5y-6z) T∈L(Fn,Fm),T(x,y,z)=(2x−y+3z,7x+5y−6z)
更一般的,
T
(
x
1
,
.
.
.
,
x
n
)
=
(
a
1
,
1
x
1
+
.
.
.
+
a
1
,
n
x
n
,
.
.
.
,
a
m
,
1
x
1
+
.
.
.
+
a
m
,
n
x
n
)
\begin{aligned} T(x_1, ..., x_n) = ( &a_{1,1}x_1 + ... + a_{1,n}x_n, \\ &..., \\ &a_{m,1}x_1 + ... + a_{m,n}x_n) \end{aligned}
T(x1,...,xn)=(a1,1x1+...+a1,nxn,...,am,1x1+...+am,nxn)
设
(
v
1
,
.
.
.
,
v
n
)
(v_1, ..., v_n)
(v1,...,vn) 是 V 的一组基,并且
T
:
V
→
W
T: V \rightarrow W
T:V→W 是线性的。如果
v
∈
V
v \in V
v∈V,那么
v
v
v 可以写成如下形式:
v
=
a
1
v
1
+
.
.
.
+
a
n
v
n
v = a_1v_1 + ... + a_nv_n
v=a1v1+...+anvn
由于
T
T
T 是线性的:
T
v
=
a
1
T
v
1
+
.
.
.
+
a
n
T
v
n
Tv = a_1Tv_1 + ... + a_nTv_n
Tv=a1Tv1+...+anTvn
线性映射可以根据其在一个基上的取值来构造,而这些取值可以是任意的。具体地,给定 V 的基
(
v
1
,
.
.
.
,
v
n
)
(v_1, ..., v_n)
(v1,...,vn) 和任意指定 的向量
w
1
,
.
.
.
,
w
n
∈
W
w_1, ..., w_n \in W
w1,...,wn∈W,我们都可以构造一个线性映射
T
:
V
→
W
T: V \rightarrow W
T:V→W 使得
T
v
j
=
w
j
,
j
=
1
,
.
.
.
,
n
Tv_j = w_j, j = 1, ..., n
Tvj=wj,j=1,...,n。因此
T
T
T 一定为:
T
(
a
1
v
1
+
.
.
.
+
a
n
v
n
)
=
a
1
w
1
+
.
.
.
a
n
w
n
T(a_1v_1 + ... + a_nv_n) = a_1w_1 + ... a_nw_n
T(a1v1+...+anvn)=a1w1+...anwn
L
(
V
,
W
)
L(V, W)
L(V,W) 上的加法和数乘,对于
S
,
T
∈
L
(
V
,
W
)
S, T \in L(V, W)
S,T∈L(V,W)
(
S
+
T
)
v
=
S
v
+
T
v
,
v
∈
V
(
a
T
)
v
=
a
(
T
v
)
,
v
∈
V
(S + T)v = Sv + Tv, v \in V \\ (aT)v = a(Tv), v \in V
(S+T)v=Sv+Tv,v∈V(aT)v=a(Tv),v∈V
一般来说,向量空间中的两个元素相乘是没有意义的,但是对于一组适当的线性映射却存在一种有用的乘积。如果
T
∈
L
(
U
,
V
)
,
S
∈
L
(
V
,
W
)
T \in L(U, V), S \in L(V, W)
T∈L(U,V),S∈L(V,W),那么
(
S
T
)
v
=
S
(
T
v
)
,
v
∈
U
(ST)v = S(Tv), v \in U
(ST)v=S(Tv),v∈U
我们称 ST 是 S 和 T 的乘积(product)。它具有乘积的大所述性质:
结合性(associativity): ( T 1 T 2 ) T 3 = T 1 ( T 2 T 3 ) (T_1T_2)T_3 = T_1(T_2T_3) (T1T2)T3=T1(T2T3)
恒等映射(identity): I T = T I = T IT = TI = T IT=TI=T
分配性(distributive properties): ( S 1 + S 2 ) T = S 1 T + S 2 T , S ( T 1 + T 2 ) = S T 1 + S T 2 (S_1 + S_2)T = S_1T + S_2T, S(T1 + T2) = ST_1 + ST_2 (S1+S2)T=S1T+S2T,S(T1+T2)=ST1+ST2
注意:线性映射的乘法是不交换的。
§3.2 零空间与值域
对于
T
∈
L
(
V
,
W
)
T \in L(V, W)
T∈L(V,W),V 中被 T 映成 0 的那些向量所组成的子集称为 T 的零空间(null space),或核空间(kernel space),记
n
u
l
l
T
null T
nullT:
n
u
l
l
T
=
{
v
∈
V
:
T
v
=
0
}
null T = \{ v \in V: Tv = 0 \}
nullT={v∈V:Tv=0}
命题:若 T ∈ L ( V , W ) T \in L(V, W) T∈L(V,W),则 null T 是 V 的子空间,且 0 包含于每个线性映射的零空间。
线性映射 T : V → W T: V \rightarrow W T:V→W 称为单的(injective),如果当 u , v ∈ V , T u = T v u, v \in V, Tu = Tv u,v∈V,Tu=Tv 时必有 u = v u = v u=v。
命题:设 T ∈ L ( V , W ) T \in L(V, W) T∈L(V,W),则 T 是单的当且仅当 n u l l T = 0 null T = {0} nullT=0。
对于
T
∈
L
(
V
,
W
)
T \in L(V, W)
T∈L(V,W),由 W 中形如
T
v
(
v
∈
V
)
Tv (v \in V)
Tv(v∈V) 的向量所组成的子集称为
T
T
T 的值域(range),记为
r
a
n
g
e
T
range T
rangeT:
r
a
n
g
e
T
=
{
T
v
:
v
∈
V
}
rangeT = \{Tv: v \in V\}
rangeT={Tv:v∈V}
命题:若 T ∈ L ( V , W ) T \in L(V, W) T∈L(V,W),那么 r a n g e T rangeT rangeT 是 W 的子空间。
线性映射 T : V → W T: V \rightarrow W T:V→W 称为满的(surjective),如果它的值域等于 W。线性映射是不是满的与我们把什么看做目标空间有关。
定理:如果 V 是有限维向量空间,并且 T ∈ L ( V , W ) T \in L(V, W) T∈L(V,W),那么 r a n g e T rangeT rangeT 是 W 的有限维子空间,并且 dim V = dim null T + dim range T。
推论:如果 V 和 W 都是有限维向量空间,并且 dim V > dim W,那么 V 到 W 的映射一定不是单的。
推论:如果 V 和 W 都是有限维向量空间,并且 dim V < dim W,那么 V 到 W 的映射一定不是满的。
对于 T x = 0 Tx = 0 Tx=0, x 1 = . . . = x n = 0 x_1 = ... = x_n = 0 x1=...=xn=0 是一个解,关键问题是,是否还有其他解。也就是说我们想知道 null T 是否严格大于 {0} 。结论:当变量多于方程时,齐次线性方程组必有非零解。
对于 T x = c Tx = c Tx=c,关键为题是,是不是对于每组常数 c = ( c 1 , . . . , c m ) ∈ F m c = (c_1, ..., c_m) \in F^m c=(c1,...,cm)∈Fm 变量 x 1 , . . . , x n x_1, ..., x_n x1,...,xn 都至少有一组解。也就数说,我们想知道 range T 是否等于 F m F^m Fm。结论:当方程对于变量时,必有一组常数项使得相应的非其次线性方程组无解。
§3.3 线性映射的矩阵
设 m 和 n 都是正整数。一个 m x n 矩阵(matrix) 是一个有 m 个行和 n 个列的矩形阵列,犹如:
[
a
1
,
1
.
.
.
a
1
,
n
.
.
.
.
.
.
a
m
,
1
.
.
.
a
m
,
n
]
\begin{bmatrix} a_{1,1} & ... & a_{1,n} \\ . & & . \\ . & & . \\ . & & . \\ a_{m,1} & ... & a_{m,n} \\ \end{bmatrix}
⎣⎢⎢⎢⎢⎡a1,1...am,1......a1,n...am,n⎦⎥⎥⎥⎥⎤
元素在 F 中的所有 m x n 矩阵之集记为
M
a
t
(
m
,
n
,
F
)
Mat(m, n, F)
Mat(m,n,F)。设
T
∈
L
(
V
,
W
)
,
(
v
1
,
.
.
.
,
v
n
)
T \in L(V, W), (v_1, ..., v_n)
T∈L(V,W),(v1,...,vn) 是 V 的基,
(
w
1
,
.
.
.
,
w
m
)
(w_1, ..., w_m)
(w1,...,wm) 是 W 的基,那么对于每个
k
=
1
,
.
.
.
,
n
,
T
v
k
k = 1, ..., n, Tv_k
k=1,...,n,Tvk 都可以唯一地写成这些
w
w
w 的线性组合:
T
v
k
=
a
1
,
k
w
1
+
.
.
.
+
a
m
,
k
w
m
Tv_k = a_{1,k}w_1 + ... + a_{m,k}w_m
Tvk=a1,kw1+...+am,kwm
其中
a
j
,
k
∈
F
,
j
=
1
,
.
.
.
,
m
a_{j,k} \in F, j = 1, ..., m
aj,k∈F,j=1,...,m。因为线性映射由其在基上的值确定,所以线性映射 T 由这些标量
a
j
,
k
a_{j,k}
aj,k 完全确定。由这些 a 所构成的 m x n 矩阵称为 T 关于基
(
v
1
,
.
.
.
,
v
n
)
(v_1, ..., v_n)
(v1,...,vn) 和基
(
w
1
,
.
.
.
,
w
m
)
(w_1, ..., w_m)
(w1,...,wm) 的矩阵(matrix),记为
M
(
T
,
(
v
1
,
.
.
.
,
v
n
)
,
(
w
1
,
.
.
.
,
w
m
)
)
M(T, (v_1, ..., v_n), (w_1, ..., w_m))
M(T,(v1,...,vn),(w1,...,wm))
可以写成如下形式:
v
1
.
.
.
v
k
.
.
.
v
n
w
1
.
.
.
w
m
[
a
1
,
k
.
.
.
a
m
,
k
]
\begin{matrix} & v_1 & ... & v_k & ... & v_n \end{matrix} \\ \begin{matrix} w_1 \\ . \\ . \\ . \\ w_m \end{matrix} \begin{bmatrix} &&&& a_{1,k} & & \\ &&&& . &&&&\\ &&&& . &&&&\\ &&&& . &&&&\\ &&&& a_{m,k} &&&&\\ \end{bmatrix}
v1...vk...vnw1...wm⎣⎢⎢⎢⎢⎡a1,k...am,k⎦⎥⎥⎥⎥⎤
v
=
b
1
v
1
+
.
.
.
+
b
n
v
n
v = b_1v_1 + ... + b_nv_n
v=b1v1+...+bnvn 的矩阵(matrix) 是一个 n x 1的矩阵,记为
M
(
v
)
M(v)
M(v),定义如下:
M
(
v
)
=
[
b
1
.
.
.
b
n
]
M(v) = \begin{bmatrix} b_1 \\ . \\ . \\ . \\ b_n \end{bmatrix}
M(v)=⎣⎢⎢⎢⎢⎡b1...bn⎦⎥⎥⎥⎥⎤
命题:设
T
∈
L
(
V
,
W
)
,
(
v
1
,
.
.
.
,
v
n
)
T \in L(V, W), (v_1, ..., v_n)
T∈L(V,W),(v1,...,vn) 是 V 的基,
(
w
1
,
.
.
.
,
w
m
)
(w_1, ..., w_m)
(w1,...,wm) 是 W 的基,那么对于每个
v
∈
V
v \in V
v∈V 都有
M
(
T
v
)
=
M
(
T
)
M
(
v
)
M(Tv) = M(T)M(v)
M(Tv)=M(T)M(v)
§3.4 可逆性
线性映射 T ∈ L ( V , W ) T \in L(V, W) T∈L(V,W) 称为可逆的(invertible),如果存在线性映射 S ∈ L ( W , V ) S \in L(W, V) S∈L(W,V) 使得 ST 等于 V 上的恒等映射,并且 TS 等于 W 上的恒等映射。S 称为 T 上的逆(inverse)。如果 T 可逆,则它的逆唯一。
命题:一个线性映射是可逆的当且仅当他既是单的,又是满的。
称两个向量空间是同构的(isomorphic),如果存在从一个向量空间到另一个向量空间的可逆线性映射。两个同构的向量空间具有相同的性质。
定理:两个向量空间同构当且仅当他们的维数相等。
命题:设 ( v 1 , . . . , v n ) (v_1, ..., v_n) (v1,...,vn) 是 V 的基, ( w 1 , . . . , w m ) (w_1, ..., w_m) (w1,...,wm) 是 W 的基,那么 M 是 L ( V , W ) L(V, W) L(V,W) 和 M a t ( m , n , F ) Mat(m, n, F) Mat(m,n,F) 之间的可逆线性映射。
命题:如果 V 和 W 都是有限维的,那么 L ( V , W ) L(V, W) L(V,W) 是有限维的,并且 d i m L ( V , W ) = ( d i m V ) ( d i m W ) dim L(V, W) = (dim V)(dim W) dimL(V,W)=(dimV)(dimW)
一个向量空间到其自身的线性映射称为算子(operator)。
定理:设 V 是有限维的。如果
T
∈
L
(
V
)
T \in L(V)
T∈L(V),那么下列等价:
a) T 是可逆的
b) T 是单的
c) T 是满的
第4章 多项式
§4.1 次数
对于函数
p
:
F
→
F
p: F \rightarrow F
p:F→F,如果存在
a
0
,
.
.
.
,
a
m
∈
F
a_0, ..., a_m \in F
a0,...,am∈F 使得对所有
z
∈
F
z \in F
z∈F 都有
p
(
z
)
=
a
0
+
a
1
z
+
a
2
z
2
+
.
.
.
+
a
m
z
m
p(z) = a_0 + a_1z + a_2z^2 + ... + a_mz^m
p(z)=a0+a1z+a2z2+...+amzm
则称 p p p 为系数在 F F F 中的多项式。如果 p p p 可以写成上述形式,其中 a m ≠ 0 a_m \neq 0 am̸=0,则称 p 的次数为 m m m。如果所有的系数 a 0 , . . . , a m a_0, ..., a_m a0,...,am 都等于 0,那么我们就说 p p p 的次数为 − ∞ - \infty −∞。
对于多项式 p ∈ P ( F ) p \in P(F) p∈P(F),如果数 λ ∈ F \lambda \in F λ∈F 满足 p ( λ ) = 0 p(\lambda) = 0 p(λ)=0 则称 λ \lambda λ 为 p p p 的根(root)。
命题:设
p
∈
P
(
F
)
p \in P(F)
p∈P(F) 是 m 次多项式,
m
≥
1
m \geq 1
m≥1。令
λ
∈
F
\lambda \in F
λ∈F,则
λ
\lambda
λ 是
p
p
p 的根当且仅当存在
m
−
1
m-1
m−1 次多项式
q
∈
P
(
F
)
q \in P(F)
q∈P(F) 使得
p
(
z
)
=
(
z
−
λ
)
q
(
z
)
,
z
∈
F
p(z) = (z - \lambda)q(z),z \in F
p(z)=(z−λ)q(z),z∈F
推论:设 p ∈ P ( F ) p \in P(F) p∈P(F) 是 m 次多项式, m ≥ 0 m \geq 0 m≥0,则 p p p 则 F F F 中最多用 m 个互不相同的根。(增量法)
推论:设
a
0
,
.
.
.
,
a
m
∈
F
a_0, ..., a_m \in F
a0,...,am∈F 如果
a
0
+
a
1
z
+
a
2
z
2
+
.
.
.
+
a
m
z
m
=
0
,
z
∈
F
a_0 + a_1z + a_2z^2 + ... + a_mz^m = 0,z \in F
a0+a1z+a2z2+...+amzm=0,z∈F
则 a 0 = . . . = a m = 0 a_0 = ... = a_m = 0 a0=...=am=0。对任意非负整数 m , ( 1 , z , . . . , z m ) m,(1, z, ..., z^m) m,(1,z,...,zm) 在 P ( F ) P(F) P(F) 中都是线性无关的。
带余除法(Division Algorithm):设 p , q ∈ P ( F ) p, q \in P(F) p,q∈P(F),并且 p ≠ 0 p \neq 0 p̸=0,则存在多项式 s , r ∈ P ( F ) s,r \in P(F) s,r∈P(F),使得 q = s p + r q = sp + r q=sp+r,并且 d e g r < d e g p deg r < deg p degr<degp。
§4.2 复系数
代数学基本定理(Fundamental Theorem of Algebra):每个不是常数的复系数多项式都是根。
推论:如果 p ∈ P ( C ) p \in P(C) p∈P(C) 是非常数多项式,则 p p p 可以唯一分解(除因子的次序之外)成如下形式 p ( z ) = c ( z − λ 1 ) . . . ( z − λ m ) p(z) = c(z - \lambda_1)...(z - \lambda_m) p(z)=c(z−λ1)...(z−λm),其中 c , λ 1 , . . . , λ m ∈ C c, \lambda_1, ..., \lambda_m \in C c,λ1,...,λm∈C。
§4.3 实系数
设 z = a + b i z = a + bi z=a+bi,其中 a a a 和 b b b 都是实数,则 a a a 称为 z z z 的实部(real part),记为 R e z Re z Rez,而 b b b 称为 z z z 的虚部(imaginary part),记为 I m z Im z Imz,于是对任意复数 z z z,都有 z = R e z + ( I m z ) i z = Re z + (Im z)i z=Rez+(Imz)i。复数 z z z 的复共轭(complex conjugate),记为 z ˉ \bar{z} zˉ,定义为 z = R e z − ( I m z ) i z = Re z - (Im z)i z=Rez−(Imz)i。
复数 z z z 的绝对值(absolute value),记为 ∣ z ∣ \vert z \vert ∣z∣,定义为 ∣ z ∣ = ( R e z ) 2 + ( I m z ) 2 \vert z \vert = \sqrt{(Re z)^2 + (Im z)^2} ∣z∣=(Rez)2+(Imz)2。 ∣ z ∣ \vert z \vert ∣z∣ 总是非负的。
命题:设 p p p 是实系数多项式。如果 λ ∈ C \lambda \in C λ∈C 是 p p p 的根,则 λ ˉ \bar{\lambda} λˉ 也是 p p p 的根。
命题:设
α
,
β
∈
R
\alpha, \beta \in R
α,β∈R,则存在形如
x
2
+
α
x
+
β
=
(
x
−
α
)
(
x
−
β
)
,
λ
1
,
λ
2
∈
R
x^2 + \alpha x + \beta = (x - \alpha)(x - \beta), \lambda_1,\lambda_2 \in R
x2+αx+β=(x−α)(x−β),λ1,λ2∈R
的多项式分解当且仅当 α 2 ≥ 4 β \alpha^2 \geq 4\beta α2≥4β。
定理:如果
p
∈
P
(
R
)
p \in P(R)
p∈P(R) 是非常数多项式,则
p
p
p 可以唯一(除因子的次序之外)分解成如下形式
p
(
x
)
=
c
(
x
−
λ
1
)
.
.
.
(
x
−
λ
m
)
(
x
2
−
α
1
x
+
β
1
)
.
.
.
(
x
2
−
α
M
x
+
β
M
)
p(x) = c(x-\lambda_1)...(x-\lambda_m)(x^2-\alpha_1x + \beta_1)...(x^2-\alpha_Mx + \beta_M)
p(x)=c(x−λ1)...(x−λm)(x2−α1x+β1)...(x2−αMx+βM)
其中 c , λ 1 , . . . , λ m ∈ R , ( α 1 , β 1 ) , . . . , ( α M , β M ) ∈ R 2 c, \lambda_1, ..., \lambda_m \in R,(\alpha_1,\beta_1), ..., (\alpha_M,\beta_M) \in R^2 c,λ1,...,λm∈R,(α1,β1),...,(αM,βM)∈R2,并且对每个 j j j 都有 α j 2 < 4 β j \alpha_j^2 < 4\beta_j αj2<4βj。 p p p 的非实根总是成对出现的。
第5章 本征值和本征向量
现在开始研究从一个向量空间到其自身的线性映射。这方面的大部分结果对无限维向量都不成立。
§5.1 不变子空间
设
T
∈
L
(
V
)
T \in L(V)
T∈L(V)。如果 V 有直和分解
V
=
U
1
⊕
.
.
.
⊕
U
m
V = U_1 \oplus ... \oplus U_m
V=U1⊕...⊕Um
其中每个 U j U_j Uj 都是 V V V 的真子空间,为了理解 T T T 的性质,我们只需理解每个 T ∣ U j T|_{U_j} T∣Uj 的性质,这里 T ∣ U j T|_{U_j} T∣Uj 表示把 T T T 限制到更小的定义域 U j U_j Uj 上。但是,如果使用算子研究中的一些有效工具(例如去幂),那么就会有一个问题: T ∣ U j T|_{U_j} T∣Uj 可能不把 U j U_j Uj 映到自身;也就是说, T ∣ U j T|_{U_j} T∣Uj 可能不是 U j U_j Uj 上的算子。
被算子映到自己的子空间十分重要,对于 T ∈ L ( V ) T \in L(V) T∈L(V) 和 V V V 的子空间 U U U,如果对每个 u ∈ U u \in U u∈U 都有 T u = U Tu = U Tu=U,则称 U U U 在 T T T 下是不变的(invariant)。
{0} 和 V V V 是 T ∈ L ( V ) T \in L(V) T∈L(V) 下的不变子空间。若 T ∈ L ( V ) T \in L(V) T∈L(V),则 n u l l T null T nullT 在 T T T 下是不变的; r a n g e T range T rangeT 在 T T T 下也是不变的。
任取非零向量
u
∈
V
u \in V
u∈V,并设
U
U
U 等于
u
u
u 的标量倍之集:
U
=
{
a
u
:
a
∈
F
}
U = \{au: a \in F\}
U={au:a∈F}
则 U U U 是 V V V 的 1 维不变子空间。
方程 T u = λ u Tu = \lambda u Tu=λu 和 1 维不变子空间密切相关,非零向量 u ∈ V u \in V u∈V 称为本征向量, λ ∈ F \lambda \in F λ∈F 称为 T T T 的本征值(eigenvalue)。
方程 T u = λ u Tu = \lambda u Tu=λu 等价于 ( T − λ I ) u = 0 (T - \lambda I) u = 0 (T−λI)u=0,故 λ \lambda λ 是本征值当且仅当 T − λ I T - \lambda I T−λI 不是单的,不是满的,不可逆。
考虑如下定义的算子
T
∈
L
(
F
2
)
T \in L(F^2)
T∈L(F2)
T
(
w
,
z
)
=
−
T
(
−
z
,
w
)
T(w, z) = -T(-z, w)
T(w,z)=−T(−z,w)
若 F = R F = R F=R,则此算子有个很好的几何解释: T T T 是 R 2 R^2 R2 中绕原点的你是正 9 0 o 90^o 90o 旋转。在 R 2 R^2 R2 中 算子 T T T 不存在特征值。求解 λ = ± i \lambda = ±i λ=±i。
定理:设 T ∈ L ( V ) , λ 1 , . . . , λ m T \in L(V), \lambda_1, ..., \lambda_m T∈L(V),λ1,...,λm 是 T T T 的互不相同的本征值, v 1 , . . . , v m v_1, ..., v_m v1,...,vm 是相应的非零本向量,则 ( v 1 , . . . , v m ) (v_1, ..., v_m) (v1,...,vm) 线性无关。
推论:V 上的每个算子最多有 d i m V dim V dimV 个互不相同的本征值。
§5.2 多项式对算子的作用
算子理论要比线性映射的理论丰富,主要原因是算子能自乘为幂。
如果
T
∈
L
(
V
)
T \in L(V)
T∈L(V),并且
p
∈
P
(
F
)
p \in P(F)
p∈P(F) 是如下多项式
p
(
z
)
=
a
0
+
a
1
z
+
a
2
z
2
+
.
.
+
a
m
z
m
,
z
∈
F
p(z) = a_0 + a_1z + a_2z^2 + .. + a_mz^m,z \in F
p(z)=a0+a1z+a2z2+..+amzm,z∈F
则
p
(
T
)
p(T)
p(T) 是如下定义的算子
p
(
T
)
=
a
0
I
+
a
1
T
+
a
2
T
2
+
.
.
.
+
a
m
T
m
p(T) = a_0I + a_1T + a_2T^2 + ... + a_mT^m
p(T)=a0I+a1T+a2T2+...+amTm
由
p
(
z
)
→
p
(
T
)
p(z) \rightarrow p(T)
p(z)→p(T) 所给出的从
P
(
F
)
P(F)
P(F) 到
L
(
V
)
L(V)
L(V) 的函数是线性的。有如下性质:
(
p
q
)
(
T
)
=
p
(
T
)
q
(
T
)
p
(
T
)
q
(
T
)
=
q
(
T
)
p
(
T
)
(pq)(T) = p(T)q(T) \\ p(T)q(T) = q(T)p(T)
(pq)(T)=p(T)q(T)p(T)q(T)=q(T)p(T)
§5.3 上三角矩阵
定理:有限维非零复向量空间上的每个算子都是本征值。
设
T
∈
L
(
V
)
T \in L(V)
T∈L(V),且
(
v
1
,
.
.
.
,
v
n
)
(v_1, ..., v_n)
(v1,...,vn) 是
V
V
V 的基,则对每个
k
=
1
,
.
.
.
,
n
k = 1, ..., n
k=1,...,n 都有
T
v
k
=
a
1
,
k
v
1
+
.
.
.
+
a
n
,
k
v
n
Tv_k = a_{1,k}v_1 + ... + a_{n,k}v_n
Tvk=a1,kv1+...+an,kvn
其中
a
j
,
k
∈
F
,
j
=
1
,
.
.
.
,
n
a_{j,k} \in F,j = 1, ..., n
aj,k∈F,j=1,...,n。下面的 n x n 矩阵
[
a
1
,
1
.
.
.
a
1
,
n
.
.
.
.
.
.
a
n
,
1
.
.
.
a
n
,
n
]
\begin{bmatrix} a_{1,1} & ... & a_{1,n} \\ . & & . \\ . & & . \\ . & & . \\ a_{n,1} & ... & a_{n,n} \end{bmatrix}
⎣⎢⎢⎢⎢⎡a1,1...an,1......a1,n...an,n⎦⎥⎥⎥⎥⎤
称为
T
T
T 关于基
(
v
1
,
.
.
.
,
v
n
)
(v_1, ..., v_n)
(v1,...,vn) 的矩阵(matrix),记为
M
(
T
,
(
v
1
,
.
.
.
,
v
n
)
)
M(T, (v_1, ..., v_n))
M(T,(v1,...,vn))
线性代数的一个中心目标就是要证明:给定一个算子 T ∈ L ( V ) T \in L(V) T∈L(V), V V V 有一个基使得 T T T 关于此基有比较简单的矩阵。(让 M(T)有更多0)
方阵的对角线(diagonal):由位于从左上角到右下角的直线上的元素组成。一个矩阵称为上三角的(upper triangular),如果位于对角线下方的元素全为0。
命题:设
T
∈
L
(
V
)
T \in L(V)
T∈L(V),并且
(
v
1
,
.
.
.
,
v
n
)
(v_1, ..., v_n)
(v1,...,vn) 是
V
V
V 的基,则下列等价:
a)
T
T
T 关于基
(
v
1
,
.
.
.
,
v
n
)
(v_1, ..., v_n)
(v1,...,vn) 的矩阵是上三角的;
b)
T
v
k
∈
s
p
a
n
(
v
1
,
.
.
.
,
v
k
)
,
k
=
1
,
.
.
.
,
n
Tv_k \in span(v_1, ..., v_k), k = 1, ..., n
Tvk∈span(v1,...,vk),k=1,...,n;
c)
s
p
a
n
(
v
1
,
.
.
.
,
v
k
)
span(v_1, ..., v_k)
span(v1,...,vk) 在
T
T
T 下是不变的,
k
=
1
,
.
.
.
,
n
k = 1, ..., n
k=1,...,n。
定理:设 V V V 是复向量空间,并设 T ∈ L ( V ) T \in L(V) T∈L(V),则 T T T 关于 V V V 的某个基具有上三角矩阵。
命题:假设 T ∈ L ( V ) T \in L(V) T∈L(V) 关于 V V V 的某个基有上三角矩阵,则 T T T 可逆当且仅当这个上三角矩阵对角线上的元素都不是 0。
命题:设 T ∈ L ( V ) T \in L(V) T∈L(V) 关于 V V V 的某个基有上三角矩阵,则这个上三角矩阵对角线上的元素恰好是 T T T 的所有本征值。
§5.4 对角矩阵
对角矩阵(diagonal matrix):是对角线意外的元素全是 0 的方阵。若算子关于某个基有对角矩阵,则对角线上的元素恰好是该算子的所有本征值。可惜并非每个算子都关于某个基有对角矩阵。这种糟糕的情况甚至可以出现在复向量空间上。
命题:若 T ∈ L ( V ) T \in L(V) T∈L(V) 有 d i m V dim V dimV 个互补相同的本征值,则 T T T 关于 V V V 的某个基有对角矩阵。
命题:设
T
∈
L
(
V
)
T \in L(V)
T∈L(V),并设
λ
1
,
.
.
.
,
λ
m
\lambda_1, ..., \lambda_m
λ1,...,λm 是
T
T
T 的所有互不相同的本征值,则下列等价:
a)
T
T
T 关于
V
V
V 的某个基有对角矩阵;
b)
V
V
V 有一个由
T
T
T 的本证特征向量组成的基;
c)
V
V
V 有在
T
T
T 下不变的 1 维子空间
U
−
1
,
.
.
.
,
U
n
U-1, ..., U_n
U−1,...,Un,使得
V
=
U
1
⊕
.
.
.
⊕
U
n
V = U_1 \oplus ... \oplus U_n
V=U1⊕...⊕Un;
d)
V
=
n
u
l
l
(
T
−
λ
1
I
)
⊕
.
.
.
⊕
n
u
l
l
(
T
−
λ
m
I
)
V = null(T - \lambda_1I) \oplus ... \oplus null(T - \lambda_mI)
V=null(T−λ1I)⊕...⊕null(T−λmI);
e)
d
i
m
V
=
d
i
m
n
u
l
l
(
T
−
λ
1
)
+
.
.
.
+
d
i
m
n
u
l
l
(
T
−
λ
m
)
dim V = dim null(T - \lambda_1) + ... + dim null(T - \lambda_m)
dimV=dimnull(T−λ1)+...+dimnull(T−λm)。
§5.5 实向量空间的不变子空间
定理:在有限维非零实向量空间中,每个算子都有 1 维或 2 维的不变子空间。
定理:在奇数维实向量空间上,每个算子都有本征值。
第6章 内积空间
我们定义线性空间时推广了 R 2 R^2 R2 和 R 3 R^3 R3 的线性结构(加法和标量乘法),而忽略了其他的重要特征,例如长度和角度的概念,这些思想蕴含于我们现在要研究的内积概念中。
§6.1 内积
R
2
R^2
R2 或
R
3
R^3
R3 中向量
x
x
x 的长度称为
x
x
x 的 范数(norm),记为
∣
∣
x
∣
∣
||x||
∣∣x∣∣。定义
x
=
(
x
1
,
.
.
.
,
x
n
)
∈
R
n
x = (x_1, ..., x_n) \in R^n
x=(x1,...,xn)∈Rn 的范数为
∣
∣
x
∣
∣
=
x
1
2
+
.
.
.
+
x
n
2
||x|| = \sqrt{x_1^2 + ... + x_n^2}
∣∣x∣∣=x12+...+xn2
范数在
R
n
R^n
Rn 上不是线性的。为了把线性引入讨论,我们来介绍点积。对于
x
,
y
∈
R
n
x, y \in R^n
x,y∈Rn,
x
x
x 与
y
y
y 的点积(dot product) 记为
x
⋅
y
x \cdot y
x⋅y,定义为
x
⋅
y
=
x
1
y
1
+
.
.
.
+
x
n
y
n
x \cdot y = x_1y_1 + ... + x_ny_n
x⋅y=x1y1+...+xnyn
注意,
R
n
R^n
Rn 中两个向量的点积是一个数,而不是一个向量。
对于复数,我们定义内积为
w
⋅
z
=
w
1
z
1
ˉ
+
.
.
.
+
w
n
z
n
ˉ
w \cdot z = w_1\bar{z_1} + ... + w_n\bar{z_n}
w⋅z=w1z1ˉ+...+wnznˉ
V V V 上的**内积(inner product)**就是一个函数,它把 V V V 中元素的每个有序对 ( u , v ) (u, v) (u,v) 都映成数 < u , v > ∈ F <u, v> \in F <u,v>∈F,并且具有下列性质:
正性(positivity)
定性(definiteness)
第一位置的加性(additivity in first slot)
第一位置的齐性(homogeneity in first slot)
共轭对称(conjugate symmetry)
内积空间(inner-product space) 是带有内积的向量空间 V V V。
定义 < ( w 1 , . . . , w n ) , ( z 1 , . . . , z n ) > = w 1 z 1 ˉ + . . . + w n z n ˉ <(w_1, ..., w_n),(z_1, ..., z_n)> = w_1\bar{z_1} + ... + w_n\bar{z_n} <(w1,...,wn),(z1,...,zn)>=w1z1ˉ+...+wnznˉ 称为 F n F^n Fn 上的欧几里得内积(Euclidean inner product)。
F n F^n Fn 上除了欧几里得内积之外还有其他的内积。若 c 1 , . . . , c n c_1, ..., c_n c1,...,cn 是正数,可以如下定义 F n F^n Fn 上的内积 < ( w 1 , . . . , w n ) , ( z 1 , . . . , z n ) > = c 1 w 1 z 1 ˉ + . . . + c n w n z n ˉ <(w_1, ..., w_n),(z_1, ..., z_n)> = c_1w_1\bar{z_1} + ... + c_nw_n\bar{z_n} <(w1,...,wn),(z1,...,zn)>=c1w1z1ˉ+...+cnwnznˉ。当所有的 c 都等于 1,则得到欧几里得内积。
对于次数不多于 m 的所有多项式的向量空间 P M ( F ) P_M(F) PM(F)。可以定义 P M ( F ) P_M(F) PM(F) 上的内积 < p , q > = ∫ 0 1 p ( x ) q ( x ) ˉ d x <p, q> = \int_0^1p(x)\bar{q(x)}dx <p,q>=∫01p(x)q(x)ˉdx
在内积空间中,第一个位置和第二个位置,都具有线性。
§6.2 范数
若 v ∈ V v \in V v∈V, v v v 的范数,记为 ∣ ∣ v ∣ ∣ || v || ∣∣v∣∣,定义为 ∣ ∣ v = < v , v > ∣ ∣ ||v = \sqrt{<v, v>}|| ∣∣v=<v,v>∣∣
若 ( z 1 , . . . , z n ) ∈ F n (z_1, ..., z_n) \in F^n (z1,...,zn)∈Fn (取欧几里得内积),那么 ∣ ∣ ( z 1 , . . . , z n ) ∣ ∣ = ∣ z 1 ∣ 2 + . . . + ∣ z n ∣ 2 ||(z_1, ..., z_n)|| = \sqrt{|z_1|^2 + ... + |z_n|^2} ∣∣(z1,...,zn)∣∣=∣z1∣2+...+∣zn∣2
若 p ∈ P m F p \in P_m{F} p∈PmF,那么 ∣ ∣ p ∣ ∣ = ∫ 0 1 ∣ p ( x ) ∣ 2 d x ||p|| = \sqrt{\int_0^1{|p(x)|^2}dx} ∣∣p∣∣=∫01∣p(x)∣2dx
注意, ∣ ∣ v ∣ ∣ = 0 ||v|| = 0 ∣∣v∣∣=0 当且仅当 v = 0 v = 0 v=0。
对所有的 a ∈ F , v ∈ V a \in F, v \in V a∈F,v∈V 都有 ∣ ∣ a v ∣ ∣ = ∣ a ∣ ∣ ∣ v ∣ ∣ ||av|| = |a|||v|| ∣∣av∣∣=∣a∣∣∣v∣∣。
处理范数的平方通常比直接处理范数容易。
对于两个向量 u , v ∈ V u, v \in V u,v∈V,如果 < u , v > = 0 <u, v> = 0 <u,v>=0,则称 u u u 和 v v v 是正交的(orthogonal)。显然 0 0 0 正交与每个向量,它是唯一正交于自身的向量。
勾股定理(毕达哥拉斯定理(Pythagorean Theorem)):如果 u , v u, v u,v 是 V V V 中的正交向量,那么 ∣ ∣ u + v ∣ ∣ 2 = ∣ ∣ u ∣ ∣ 2 + ∣ ∣ v ∣ ∣ 2 ||u + v||^2 = ||u||^2 + ||v||^2 ∣∣u+v∣∣2=∣∣u∣∣2+∣∣v∣∣2。
柯西——施瓦茨不等式(Cauchy-Schwarz Inequality):若 u , v ∈ V u, v \in V u,v∈V,则 ∣ < u , v > ∣ ≤ ∣ ∣ u ∣ ∣ ∣ ∣ v ∣ ∣ |<u, v>| \le ||u|| ||v|| ∣<u,v>∣≤∣∣u∣∣∣∣v∣∣,而且其中的等号成立当且仅当 u , v u, v u,v 之一是另一个的标量倍。
三角不等式(Triangle Inequality):若 u , v ∈ V u, v \in V u,v∈V,则 ∣ < u , v > ∣ ≤ ∣ ∣ u ∣ ∣ + ∣ ∣ v ∣ ∣ |<u, v>| \le ||u|| + ||v|| ∣<u,v>∣≤∣∣u∣∣+∣∣v∣∣,而且其中等号成立当且仅当 u , v u, v u,v 之一是拎一个的非负标量倍。
平行四边形等式(Parallelogram Equality):若 u , v ∈ V u, v \in V u,v∈V,则 ∣ ∣ u + v ∣ ∣ 2 + ∣ ∣ u − v ∣ ∣ 2 = 2 ( ∣ ∣ u ∣ ∣ 2 + ∣ ∣ v ∣ ∣ 2 ) ||u + v||^2 + ||u - v||^2 = 2(||u||^2 + ||v||^2) ∣∣u+v∣∣2+∣∣u−v∣∣2=2(∣∣u∣∣2+∣∣v∣∣2)。
§6.3 规范正交基
如果一个向量组中的向量两两正交,并且每个向量的范数都为 1 1 1,则称这个向量组是规范正交的(orthonormal)。
命题:如果 V V V 中向量组 ( e 1 , . . . , e m ) (e_1, ..., e_m) (e1,...,em) 是规范正交的,那么 ∣ ∣ a 1 e 1 + . . . + a m e m ∣ ∣ 2 = ∣ a 1 ∣ 2 + . . . + ∣ a m ∣ 2 ||a_1e_1 + ... + a_me_m||^2 = |a_1|^2 + ... + |a_m|^2 ∣∣a1e1+...+amem∣∣2=∣a1∣2+...+∣am∣2,其中 a 1 , . . . , a m ∈ F a_1, ..., a_m \in F a1,...,am∈F。
推论:每个规范正交向量组都是线性无关的。
V 的规范正交基(orthonormal basis) 是 V V V 中的一个规范正交向量构成的基。
定理:设 e 1 , . . . , e n e_1, ..., e_n e1,...,en 是 V V V 的规范正交基,则对每个 v ∈ V v \in V v∈V,都有 v = < v , e 1 > e 1 + . . . + < v , e n > e n v = <v, e_1>e_1 + ... + <v, e_n>e_n v=<v,e1>e1+...+<v,en>en 而且 ∣ ∣ v ∣ ∣ 2 = ∣ < v , e 1 > ∣ 2 + . . . + ∣ < v , e n > ∣ 2 ||v||^2 = |<v, e_1>|^2 + ... + |<v, e_n>|^2 ∣∣v∣∣2=∣<v,e1>∣2+...+∣<v,en>∣2
格拉姆——施密特过程(Gram-Schmidt procedure):如果
(
v
1
,
.
.
.
,
v
m
)
(v_1, ..., v_m)
(v1,...,vm) 是
V
V
V 中的线性无关向量组,则
V
V
V 有规范正交向量组
(
e
1
,
.
.
.
,
e
m
)
(e_1, ..., e_m)
(e1,...,em) 使得
s
p
a
n
(
v
1
,
.
.
.
,
v
j
−
1
)
=
s
p
a
n
(
e
1
,
.
.
.
,
e
j
−
1
)
span(v_1, ..., v_{j-1}) = span(e_1, ..., e_{j-1})
span(v1,...,vj−1)=span(e1,...,ej−1)
令
e
j
=
v
j
−
<
v
j
,
e
1
>
e
1
−
.
.
.
−
<
v
j
,
e
j
−
1
>
e
j
−
1
∣
∣
v
j
−
<
v
j
,
e
1
>
e
1
−
.
.
.
−
<
v
j
,
e
j
−
1
>
e
j
−
1
∣
∣
.
e_j = \frac{v_j-<v_j, e_1>e_1 - ... - <v_j, e_{j-1}>e_{j-1}}{||v_j-<v_j, e_1>e_1 - ... - <v_j, e_{j-1}>e_{j-1}||}.
ej=∣∣vj−<vj,e1>e1−...−<vj,ej−1>ej−1∣∣vj−<vj,e1>e1−...−<vj,ej−1>ej−1.
推论:每个有限维内积空间都有规范正交基。
推论: V V V 中每个规范正交向量组都可以扩充成 V V V 的规范正交基。
推论:假设 T ∈ L ( V ) T \in L(V) T∈L(V)。如果 T T T 关于 V V V 的某个基具有上三角矩阵,那么 T T T 关于 V V V 的某个规范正交基也具有上三角矩阵。
推论:设 V V V 是复向量空间,并且 T ∈ L ( V ) T \in L(V) T∈L(V),则 T T T 关于 V V V 的某个规范正交基具有上三角矩阵。