一、线性空间
给定非空集合
V
\bm{V}
V和域
F
\bm{F}
F,若存在映射
σ
:
V
×
V
→
V
(
V
1
,
V
2
)
↦
σ
(
V
1
,
V
2
)
\begin{aligned} & \bm{σ} : \bm{V} × \bm{V} \rightarrow \bm{V}\\ & \ \ \ \ \ \ (V_1, V_2)\mapsto\bm{σ}(V_1, V_2) \end{aligned}
σ:V×V→V (V1,V2)↦σ(V1,V2)则称
σ
\bm{σ}
σ为
V
\bm{V}
V上的加法。
其中
V
×
V
\bm{V} × \bm{V}
V×V的运算称为集合的卡氏积【Cartesian product】,又名笛卡尔积,形如
S
1
×
S
2
=
{
(
s
1
,
s
2
)
∣
s
1
∈
S
1
,
s
2
∈
S
2
}
\bm{S_1} × \bm{S_2} = \{(s_1, s_2)|s_1\in \bm{S_1},s_2\in \bm{ S_2}\}
S1×S2={(s1,s2)∣s1∈S1,s2∈S2}这些有序对的全体构成了新的集合,称为其卡氏积。
在一个运算系统中,如果该系统是封闭的,则称该系统为一个域。典型的有有理数域,实数域与复数域,而自然数等集合无法完全进行基本运算,并非封闭,不能成为域。
先回顾通常的运算规则,包括加法的交换律
v
1
+
v
2
=
v
2
+
v
1
v_1 + v_2 = v_2 + v_1
v1+v2=v2+v1加法的结合律
(
v
1
+
v
2
)
+
v
3
=
v
1
+
(
v
2
+
v
3
)
(v_1 + v_2) + v_3 = v_1 + (v_2 + v_3)
(v1+v2)+v3=v1+(v2+v3)加法的有零元
∃
e
∈
V
,
e
+
v
=
v
\exists e\in \bm{V}, e + v = v
∃e∈V,e+v=v加法的有负元
∀
v
∈
V
,
∃
a
∈
V
,
v
+
a
=
e
\forall v\in \bm{V}, \exists a\in \bm{V}, v + a = e
∀v∈V,∃a∈V,v+a=e记
a
=
−
v
a = - v
a=−v。以及数乘法的向量与数分配律
(
v
1
+
v
2
)
k
=
v
1
k
+
v
2
k
(v_1 + v_2)k = v_1k + v_2k
(v1+v2)k=v1k+v2k
v
(
k
1
+
k
2
)
=
v
k
1
+
v
k
2
v(k_1 + k_2) = vk_1 + vk_2
v(k1+k2)=vk1+vk2数乘法的结合律
v
(
k
l
)
=
(
v
k
)
l
v(kl) = (vk)l
v(kl)=(vk)l其中
k
k
k与
l
l
l是域
F
\bm{F}
F的任意数。乘法的1元
v
1
=
v
v1 = v
v1=v其中在数乘中,若向量为列向量,数乘法的数写在右侧;反之亦然,如此这般可以将数化为1×1的向量,由此等效为矩阵乘法。
给定非空集合
V
\bm{V}
V和域
F
\bm{F}
F,在集合
V
\bm{V}
V的元素之间定义加法与数乘法,若满足以上四条加法法则与四条数乘法法则,则称集合
V
\bm{V}
V为域
F
\bm{F}
F的线性空间。
将几何空间作为线性空间,来理解线性空间。定义
V
\bm{V}
V为有向线段的全体,
F
\bm{F}
F为实数域,考察加法为平行四边形法则,数乘法为正反向伸缩,并考察八条运算规律。
再考虑函数空间,以一定区间
X
X
X为定义域,具有n个分量的n维向量值函数,将该向量作为一个元素,则所有这些函数的集合称为函数空间,记
F
(
X
,
R
n
)
=
{
f
∣
f
=
[
f
1
(
x
)
,
.
.
.
,
f
n
(
x
)
]
T
,
x
∈
X
}
F(X, \bm{R}^n) = \{ \bm{f}|\bm{f} = [f_1(x), ..., f_n(x)]^T, x\in X \}
F(X,Rn)={f∣f=[f1(x),...,fn(x)]T,x∈X}并考虑向量加法与数乘法,以考察八条运算规则。
二、向量空间与线性相关性
定义向量组,由p个元素排列组成的有限序列
a
1
,
a
2
,
.
.
.
,
a
p
\bm{a_1}, \bm{a_2}, ..., \bm{a_p}
a1,a2,...,ap及向量组运算得到的抽象矩阵
(
a
1
,
a
2
,
.
.
.
,
a
p
)
\left( \begin{matrix}\bm{a_1}, \bm{a_2}, ..., \bm{a_p} \end{matrix} \right )
(a1,a2,...,ap),并定义若
∃
k
=
[
k
1
,
k
2
,
.
.
.
,
k
p
]
T
≠
0
,
k
∈
F
p
\exists \bm{k} = [k_1, k_2 , ..., k_p]^T \ne \bm{0}, \bm{k} \in \bm{F}^p
∃k=[k1,k2,...,kp]T=0,k∈Fp,使得
(
a
1
,
a
2
,
.
.
.
,
a
p
)
k
=
0
\left( \begin{matrix}\bm{a_1}, \bm{a_2}, ..., \bm{a_p} \end{matrix} \right ) \bm{k} = \bm{0}
(a1,a2,...,ap)k=0则称向量组
a
1
,
a
2
,
.
.
.
,
a
p
\bm{a_1}, \bm{a_2}, ..., \bm{a_p}
a1,a2,...,ap为线性相关;若向量组
a
1
,
a
2
,
.
.
.
,
a
p
\bm{a_1}, \bm{a_2}, ..., \bm{a_p}
a1,a2,...,ap不是线性相关的,则成为线性无关。再考虑线性相关性的矩阵描述,即方程组
(
a
1
,
a
2
,
.
.
.
,
a
p
)
(
x
1
,
x
2
,
.
.
.
,
x
p
)
T
=
0
\left( \begin{matrix}\bm{a_1}, \bm{a_2}, ..., \bm{a_p} \end{matrix} \right ) \left( \begin{matrix}x_1, x_2, ..., x_p \end{matrix} \right )^T = \bm{0}
(a1,a2,...,ap)(x1,x2,...,xp)T=0当向量组
a
1
,
a
2
,
.
.
.
,
a
p
\bm{a_1}, \bm{a_2}, ..., \bm{a_p}
a1,a2,...,ap线性相关时,该方程组有非零解;反之,则仅有零解。
考虑两个向量组
a
1
,
a
2
,
.
.
.
,
a
p
\bm{a_1}, \bm{a_2}, ..., \bm{a_p}
a1,a2,...,ap与
b
1
,
b
2
,
.
.
.
,
b
q
\bm{b_1}, \bm{b_2}, ..., \bm{b_q}
b1,b2,...,bq,以及向量
b
\bm{b}
b,若
∃
k
=
[
k
1
,
k
2
,
.
.
.
,
k
p
]
T
,
k
∈
F
p
\exists \bm{k} = [k_1, k_2 , ..., k_p]^T, \bm{k} \in \bm{F}^p
∃k=[k1,k2,...,kp]T,k∈Fp,使得
(
a
1
,
a
2
,
.
.
.
,
a
p
)
k
=
b
\left( \begin{matrix}\bm{a_1}, \bm{a_2}, ..., \bm{a_p} \end{matrix} \right ) \bm{k} = \bm{b}
(a1,a2,...,ap)k=b则称
b
\bm{b}
b可由
a
1
,
a
2
,
.
.
.
,
a
p
\bm{a_1}, \bm{a_2}, ..., \bm{a_p}
a1,a2,...,ap线性表示。而每个
b
i
\bm{b_i}
bi都可以由
a
1
,
a
2
,
.
.
.
,
a
p
\bm{a_1}, \bm{a_2}, ..., \bm{a_p}
a1,a2,...,ap线性表示,则称
b
1
,
b
2
,
.
.
.
,
b
q
\bm{b_1}, \bm{b_2}, ..., \bm{b_q}
b1,b2,...,bq可由
a
1
,
a
2
,
.
.
.
,
a
p
\bm{a_1}, \bm{a_2}, ..., \bm{a_p}
a1,a2,...,ap线性表示。矩阵表示为
(
a
1
,
a
2
,
.
.
.
,
a
p
)
(
x
1
,
x
2
,
.
.
.
,
x
p
)
T
=
b
\left( \begin{matrix}\bm{a_1}, \bm{a_2}, ..., \bm{a_p} \end{matrix} \right ) \left( \begin{matrix}x_1, x_2, ..., x_p \end{matrix} \right )^T = \bm{b}
(a1,a2,...,ap)(x1,x2,...,xp)T=b当
b
\bm{b}
b可由
a
i
\bm{a_i}
ai线性表示时,该非齐次线性方程组有解。同样,向量组之间的线性关系由矩阵表示为
A
X
p
×
q
=
B
\bm{A}\bm{X}_{p×q} = \bm{B}
AXp×q=B当向量组之间线性相关时,该矩阵方程组有解。
线性表示关系具有传递性。考虑三个向量组
{
a
i
}
,
{
b
j
}
,
{
c
k
}
\{\bm{a_i}\}, \{\bm{b_j}\}, \{\bm{c_k}\}
{ai},{bj},{ck},记当
A
\bm{A}
A可由
B
\bm{B}
B组合为
A
≤
l
i
n
B
\bm{A} \le_{lin} \bm{B}
A≤linB则有若
b
j
≤
l
i
n
a
i
,
c
k
≤
l
i
n
b
j
\bm{b_j} \le_{lin} \bm{a_i}, \bm{c_k} \le_{lin} \bm{b_j}
bj≤linai,ck≤linbj,则
c
k
≤
l
i
n
a
i
\bm{c_k} \le_{lin} \bm{a_i}
ck≤linai,其矩阵方程的表示为
A
X
=
B
B
Y
=
C
\bm{A}\bm{X} = \bm{B} \\ \bm{B}\bm{Y} = \bm{C}
AX=BBY=C有解,则
A
Z
=
C
\bm{A}\bm{Z} = \bm{C}
AZ=C自然有解
Z
=
X
Y
\bm{Z} = \bm{X}\bm{Y}
Z=XY 从母序列中挑出一个子序列构成向量组,这个子序列构成的向量组为原来母序列的子组。取
{
a
i
}
\{\bm{a_i}\}
{ai}的子组
{
b
j
}
\{\bm{b_j}\}
{bj},若
{
b
j
}
\{\bm{b_j}\}
{bj}线性无关,且当满足
{
a
i
}
\{\bm{a_i}\}
{ai}的子组
{
c
k
}
\{\bm{c_k}\}
{ck},
{
b
j
}
\{\bm{b_j}\}
{bj}也是
{
c
k
}
\{\bm{c_k}\}
{ck}的子组时,若对于
s
<
t
s < t
s<t,其中
s
,
t
s, t
s,t是两向量组
{
b
j
}
\{\bm{b_j}\}
{bj},
{
c
k
}
\{\bm{c_k}\}
{ck}的维度,都有
{
c
k
}
\{\bm{c_k}\}
{ck}线性相关,则此时称
{
b
j
}
\{\bm{b_j}\}
{bj}为
{
a
i
}
\{\bm{a_i}\}
{ai}的最大无关组。母组可由其极大线性无关组线性表示。极大线性无关组具有无关性与表示性,即组向量之间线性无关,并且母序列的任意向量组可由极大线性无关组线性表示。
极大线性无关组的向量是不唯一的,但向量数是唯一的。考虑母序列
A
=
{
a
i
}
\bm{A} = \{\bm{a_i}\}
A={ai}的极大线性无关组
B
=
{
b
j
}
\bm{B} = \{\bm{b_j}\}
B={bj}与
C
=
{
c
k
}
\bm{C} = \{\bm{c_k}\}
C={ck},其维度分别为
s
,
t
s, t
s,t,有
B
X
=
A
A
Y
=
C
\bm{B}\bm{X} = \bm{A} \\ \bm{A}\bm{Y} = \bm{C}
BX=AAY=C有解,于是
B
Z
=
C
\bm{B}\bm{Z} = \bm{C}
BZ=C有解,解为
Z
s
×
t
\bm{Z}_{s×t}
Zs×t,考虑严格的
s
<
t
s < t
s<t,则
Z
s
×
t
\bm{Z}_{s×t}
Zs×t可以看成不定方程,即方程数小于未知数个数的方程的系数矩阵。而易证不定方程有无数的非零解。考虑矩阵方程
Z
W
=
0
\bm{Z}\bm{W} = \bm{0}
ZW=0显然,该方程有非零解。带入上述方程,有
B
Z
W
=
C
W
\bm{B}\bm{Z}\bm{W} = \bm{C}\bm{W}
BZW=CW可以得到
C
W
=
0
\bm{C}\bm{W} = \bm{0}
CW=0有非零解。然而
C
=
{
c
k
}
\bm{C} = \{\bm{c_k}\}
C={ck}是一个线性无关组,
C
W
=
0
\bm{C}\bm{W} = \bm{0}
CW=0不存在非零解,故矛盾,而
s
>
t
s > t
s>t亦然,证毕。
向量组的极大线性无关组所含向量的个数称为向量组的秩【Rank】。秩是向量组的内在性质,不随极大线性无关组的选择而改变。
三、基与坐标
取域
F
\bm{F}
F上的线性空间
V
\bm{V}
V,如果有正整数
N
\bm{N}
N及
V
\bm{V}
V中的向量组
A
=
{
a
i
}
\bm{A} = \{\bm{a_i}\}
A={ai},使得
A
\bm{A}
A线性无关,并且
∀
a
∈
V
\forall \bm{a} \in \bm{V}
∀a∈V都可以由
{
a
i
}
\{\bm{a_i}\}
{ai}线性表示,即
a
=
A
n
×
n
k
n
×
1
\bm{a} = \bm{A}_{n×n}\bm{k}_{n×1}
a=An×nkn×1则称
V
\bm{V}
V是n维线性空间。则
{
a
i
}
\{\bm{a_i}\}
{ai}称为
V
\bm{V}
V的一个基向量。而
k
∈
F
n
\bm{k} \in \bm{F}^n
k∈Fn称为
a
∈
V
\bm{a} \in \bm{V}
a∈V沿着该基的坐标向量。 一个空间的不同基向量的个数是相同的,因为基都是该空间的极大线性无关组,即空间的维度是固定的。
基或坐标系实现了抽象线性空间到标准线性空间之间的一一对应,即
∀
τ
:
S
1
→
S
2
\forall τ:S_1\rightarrow S_2
∀τ:S1→S2,
∃
ρ
:
S
2
→
S
1
\exists ρ:S_2\rightarrow S_1
∃ρ:S2→S1,使得
τ
ρ
τρ
τρ是
S
1
S_1
S1的恒等映射,而
ρ
τ
ρτ
ρτ是
S
2
S_2
S2的恒等映射。这就认为这两个抽象集合是重构的。
考虑n维空间
V
\bm{V}
V的基
{
a
i
}
\{\bm{a_i}\}
{ai},与该基下的坐标
k
\bm{k}
k,则抽象空间
V
\bm{V}
V与标准线性空间
F
n
\bm{F}^n
Fn的映射关系,即
v
∈
V
\bm{v} \in \bm{V}
v∈V可以映射为
k
\bm{k}
k。
∀
k
∈
F
n
\forall \bm{k} \in \bm{F}^n
∀k∈Fn,其在
V
\bm{V}
V的映射为
v
=
a
k
=
[
a
1
,
.
.
.
,
a
n
]
[
k
1
,
.
.
.
,
k
n
]
T
\bm{v} = \bm{a}\bm{k} = [\bm{a}_1, ..., \bm{a}_n][k_1, ..., k_n]^T
v=ak=[a1,...,an][k1,...,kn]T;对应的,若
v
\bm{v}
v与
v
′
\bm{v}'
v′的映射均为
k
\bm{k}
k,则有
v
′
=
[
a
1
,
.
.
.
,
a
n
]
[
k
1
′
,
.
.
.
,
k
n
′
]
T
\bm{v}' = [\bm{a}_1, ..., \bm{a}_n][k_1', ..., k_n']^T
v′=[a1,...,an][k1′,...,kn′]T,由于线性无关性,有
[
a
1
,
.
.
.
,
a
n
]
[
k
1
′
−
k
1
,
.
.
.
,
k
n
′
−
k
n
]
T
=
0
[\bm{a}_1, ..., \bm{a}_n][k_1'-k_1, ..., k_n'-k_n]^T = 0
[a1,...,an][k1′−k1,...,kn′−kn]T=0,故
v
′
=
[
a
1
,
.
.
.
,
a
n
]
[
k
1
′
,
.
.
.
,
k
n
′
]
T
=
[
a
1
,
.
.
.
,
a
n
]
[
k
1
,
.
.
.
,
k
n
]
T
\bm{v}' = [\bm{a}_1, ..., \bm{a}_n][k_1', ..., k_n']^T = [\bm{a}_1, ..., \bm{a}_n][k_1, ..., k_n]^T
v′=[a1,...,an][k1′,...,kn′]T=[a1,...,an][k1,...,kn]T,即
v
=
v
′
\bm{v} = \bm{v}'
v=v′。
标准线性空间的基称为标准基,标准基组成的基矩阵称为单位矩阵,单位矩阵的列向量组是标准基向量组。再考虑任意的线性空间的基。所谓基者,就是一个无关向量组。对于n维空间,其秩为n,即线性无关。而对于表示性,即对任意的线性无关向量组
A
\bm{A}
A,
A
x
=
b
\bm{A}\bm{x} = \bm{b}
Ax=b一定有解,这显然成立。而该方程组亦可以看作
b
\bm{b}
b沿着基向量
A
\bm{A}
A展开的问题。
考虑理解无限维空间, 定义
F
n
[
x
]
F_n[x]
Fn[x]是以x为未知项的小于n次的多项式的函数空间,则
F
n
[
x
]
F_n[x]
Fn[x]的维度为n,其基为
[
1
,
x
,
.
.
.
,
x
n
−
1
]
[1, x, ..., x^{n-1}]
[1,x,...,xn−1],其中
1
∈
F
n
[
x
]
1 \in F_n[x]
1∈Fn[x],是一个函数。则任意多项式可以由该基表示。其线性无关性,考虑证明
[
1
,
.
.
.
,
x
n
−
1
]
[
a
1
,
.
.
.
,
a
n
]
T
=
0
[1, ..., x^{n-1}][a_1, ..., a_n]^T = 0
[1,...,xn−1][a1,...,an]T=0,则
a
i
=
0
a_i=0
ai=0。其中
0
∈
F
n
[
x
]
0 \in F_n[x]
0∈Fn[x]。分别令
x
=
1
,
2
,
.
.
.
,
n
x = 1, 2, ..., n
x=1,2,...,n,对于
[
x
0
,
.
.
.
,
x
n
−
1
]
[
a
1
,
.
.
.
,
a
n
]
T
=
0
[x^0, ..., x^{n-1}][a_1, ..., a_n]^T = 0
[x0,...,xn−1][a1,...,an]T=0,有
(
1
0
1
1
.
.
.
1
n
−
1
2
0
2
1
.
.
.
2
n
−
1
.
.
.
n
0
n
1
.
.
.
n
n
−
1
)
(
a
1
a
2
.
.
.
a
n
)
=
(
0
0
.
.
.
0
)
\left( \begin{matrix}1^0 & 1^1 & ... & 1^{n-1} \\ 2^0 & 2^1 & ... & 2^{n-1} \\... & & & \\n^0 & n^1 & ... & n^{n-1} \end{matrix} \right )\left( \begin{matrix}a_1 \\ a_2 \\...\\a_{n} \end{matrix} \right ) = \left( \begin{matrix} 0 \\ 0 \\...\\ 0 \end{matrix} \right )
⎝⎜⎜⎛1020...n01121n1.........1n−12n−1nn−1⎠⎟⎟⎞⎝⎜⎜⎛a1a2...an⎠⎟⎟⎞=⎝⎜⎜⎛00...0⎠⎟⎟⎞考虑范德蒙行列式,则
a
i
=
0
a_i=0
ai=0。而考虑
F
∞
[
x
]
F_\infty[x]
F∞[x],其不是有限维的,任意有限个向量都不是其基。考虑n维基与n次项,考虑表示性,有
[
x
0
,
.
.
.
,
x
n
−
1
]
[
a
1
,
.
.
.
,
a
n
]
T
=
x
n
[x^0, ..., x^{n-1}][a_1, ..., a_n]^T = x^{n}
[x0,...,xn−1][a1,...,an]T=xn,即
[
x
0
,
.
.
.
,
x
n
−
1
,
x
n
]
[
a
1
,
.
.
.
,
a
n
,
−
1
]
T
=
0
[x^0, ..., x^{n-1}, x^n][a_1, ..., a_n, -1]^T = 0
[x0,...,xn−1,xn][a1,...,an,−1]T=0,再考虑无关性,有
[
x
0
,
.
.
.
,
x
n
−
1
,
x
n
]
[
a
1
,
.
.
.
,
a
n
,
a
n
+
1
]
T
=
0
[x^0, ..., x^{n-1}, x^n][a_1, ..., a_n, a_{n+1}]^T = 0
[x0,...,xn−1,xn][a1,...,an,an+1]T=0,得到解为
a
n
+
1
=
−
1
a_{n+1} = -1
an+1=−1,这与线性无关组的条件
a
i
=
0
a_i = 0
ai=0矛盾,显然不是线性无关组。于是该n维不是一个基,即没有有限维基,即该空间不是一个有限维空间。
四、子空间
考虑线性空间
V
\bm{V}
V,以及
V
\bm{V}
V的非空子集
W
\bm{W}
W,其对加法封闭,即
∀
a
,
b
∈
W
,
a
+
b
∈
W
\forall a,b \in \bm{W}, a+b \in \bm{W}
∀a,b∈W,a+b∈W;以及对数乘法封闭,
∀
a
∈
W
,
∀
k
∈
R
,
k
a
∈
W
\forall a \in \bm{W}, \forall k \in \bm{R}, ka \in \bm{W}
∀a∈W,∀k∈R,ka∈W,则称
W
\bm{W}
W是
V
\bm{V}
V的子空间。
W
\bm{W}
W也是线性空间。
考虑线性空间
V
\bm{V}
V,取向量组为
{
a
p
}
\{\bm{a}_p\}
{ap},取集合
s
p
a
n
{
a
p
}
=
{
a
1
c
1
+
.
.
.
+
a
p
c
p
∣
c
i
∈
F
}
span\{\bm{a}_p\} = \{\bm{a}_1c_1 + ... +\bm{a}_pc_p|c_i \in \bm{F}\}
span{ap}={a1c1+...+apcp∣ci∈F},则
s
p
a
n
{
a
p
}
span\{\bm{a}_p\}
span{ap}是
V
\bm{V}
V的一个子空间,并称为
{
a
p
}
\{\bm{a}_p\}
{ap}的生成子空间。反而言之,对于
V
\bm{V}
V的子空间
W
\bm{W}
W与
{
a
p
}
\{\bm{a}_p\}
{ap},有
W
=
s
p
a
n
{
a
p
}
\bm{W} = span\{\bm{a}_p\}
W=span{ap},则
{
a
p
}
\{\bm{a}_p\}
{ap}是
W
\bm{W}
W的一个生成组。生成组提供了子空间的一种表现方式。
考虑矩阵
A
∈
R
m
×
n
\bm{A} \in \bm{R}^{m×n}
A∈Rm×n,则
{
x
∣
A
x
=
0
,
x
∈
F
n
}
\{\bm{x}|\bm{A}\bm{x} = \bm{0}, \bm{x}\in \bm{F}^n\}
{x∣Ax=0,x∈Fn}是
F
n
\bm{F}^n
Fn的子空间,其封闭性易证。即齐次方程组的解集合是
F
n
\bm{F}^n
Fn的子空间。定义
k
e
r
A
=
{
x
∣
A
x
=
0
,
x
∈
F
n
}
ker \bm{A} = \{\bm{x}|\bm{A}\bm{x} = \bm{0},\bm{x}\in \bm{F}^n\}
kerA={x∣Ax=0,x∈Fn},称为
A
\bm{A}
A的核,用来代表以
A
\bm{A}
A为系数矩阵的线性方程组的解空间。再考虑
{
A
x
∣
x
∈
F
n
}
\{\bm{A}\bm{x}|\bm{x}\in \bm{F}^n\}
{Ax∣x∈Fn},其是
F
m
\bm{F}^m
Fm的子空间。定义
i
m
A
im \bm{A}
imA,称为
A
\bm{A}
A的像,表示
A
\bm{A}
A的列向量组以
x
\bm{x}
x为系数的线性组合,即
A
\bm{A}
A的列向量组的生成子空间。
考虑线性空间
V
\bm{V}
V的子空间
W
\bm{W}
W与
U
\bm{U}
U,则
W
\bm{W}
W与
U
\bm{U}
U的交集也是子空间,
W
\bm{W}
W与
U
\bm{U}
U的和也是子空间。
五、线性映射
V
1
\bm{V_1}
V1和
V
2
\bm{V_2}
V2时
R
\bm{R}
R上的线性空间,对于映射
σ
:
V
1
→
V
2
σ:\bm{V_1}\rightarrow\bm{V_2}
σ:V1→V2,若有
σ
(
e
1
+
e
2
)
=
σ
(
e
1
)
+
σ
(
e
2
)
σ(\bm{e}_1 + \bm{e}_2) = σ(\bm{e}_1) + σ(\bm{e}_2)
σ(e1+e2)=σ(e1)+σ(e2)的保加性,与
σ
(
e
k
)
=
k
σ
(
e
)
σ(\bm{e}k) = kσ(\bm{e})
σ(ek)=kσ(e)的保数乘性,则称该映射为
V
1
\bm{V_1}
V1到
V
2
\bm{V_2}
V2的线性映射。当
V
1
=
V
2
=
V
\bm{V_1} = \bm{V_2} = \bm{V}
V1=V2=V时,则称为
V
\bm{V}
V上的线性变换。
若线性映射
σ
σ
σ是可逆映射,则称
σ
σ
σ为线性同构。即任一元素存在像且像唯一,任一像都有原像且原像唯一,则该两个线性空间的结构完全相同。有限维的线性空间即与同维的标准线性空间同构。
考虑矩阵与标准线性空间之间的线性映射,两者之间的等同性,即取矩阵
A
∈
F
m
×
n
\bm{A}\in\bm{F}^{m×n}
A∈Fm×n,则线性映射可表示为
A
:
F
n
→
F
m
x
↦
y
=
A
x
\begin{aligned} \bm{A}:&\bm{F}^{n}\rightarrow\bm{F}^{m} \\ &\bm{x} \mapsto\bm{y} = \bm{A}\bm{x}\end{aligned}
A:Fn→Fmx↦y=Ax反之,记
F
n
\bm{F}^{n}
Fn的标准基
e
1
,
.
.
.
,
e
n
\bm{e}_1, ..., \bm{e}_n
e1,...,en,则对于线性映射
A
\bm{A}
A,考虑矩阵
A
=
(
A
(
e
1
)
,
.
.
.
,
A
(
e
n
)
)
\bm{A} = (\bm{A}(\bm{e}_1), ..., \bm{A}(\bm{e}_n))
A=(A(e1),...,A(en)),则任取
x
∈
F
n
\bm{x} \in \bm{F}^n
x∈Fn,有
x
=
I
x
=
e
1
x
1
+
.
.
.
+
e
n
x
n
\begin{aligned} \bm{x} &= \bm{I}\bm{x} \\ &= \bm{e}_1x_1 + ... + \bm{e}_nx_n \end{aligned}
x=Ix=e1x1+...+enxn则
x
\bm{x}
x的映射
A
(
x
)
=
A
(
e
1
x
1
)
+
.
.
.
+
A
(
e
n
x
n
)
=
x
1
A
(
e
1
)
+
.
.
.
+
x
n
A
(
e
n
)
=
(
A
(
e
1
)
,
.
.
.
,
A
(
e
n
)
)
x
=
A
x
\begin{aligned} \bm{A}(\bm{x}) &= \bm{A}(\bm{e}_1x_1) + ... + \bm{A}(\bm{e}_nx_n) \\ &= x_1\bm{A}(\bm{e}_1) + ... + x_n\bm{A}(\bm{e}_n) \\ &= (\bm{A}(\bm{e}_1), ..., \bm{A}(\bm{e}_n))\bm{x} \\ &= \bm{A}\bm{x} \end{aligned}
A(x)=A(e1x1)+...+A(enxn)=x1A(e1)+...+xnA(en)=(A(e1),...,A(en))x=Ax即任一抽象的线性映射都可由矩阵实现。
再考虑线性映射的矩阵表示,给定线性映射
A
:
V
→
W
,
d
i
m
(
V
)
=
n
,
d
i
m
(
W
)
=
m
\bm{A}:\bm{V}\rightarrow\bm{W},dim(\bm{V}) = n, dim(\bm{W}) = m
A:V→W,dim(V)=n,dim(W)=m取
V
\bm{V}
V的基
e
1
,
.
.
.
,
e
n
\bm{e}_1, ..., \bm{e}_n
e1,...,en,称其为入口基;与
W
\bm{W}
W的基
η
1
,
.
.
.
,
η
m
\bm{η}_1, ..., \bm{η}_m
η1,...,ηm,称为出口基。记第j个入口基向量
e
j
\bm{e}_j
ej的像
A
(
e
j
)
\bm{A}(\bm{e}_j)
A(ej)在出口基下的坐标为
(
a
1
j
,
.
.
.
,
a
m
j
)
T
(a_{1j}, ...,a_{mj})^T
(a1j,...,amj)T,则
A
(
e
j
)
=
(
η
1
,
.
.
.
,
η
m
)
(
a
1
j
,
.
.
.
,
a
m
j
)
T
\bm{A}(\bm{e}_j) = (\bm{η}_1, ..., \bm{η}_m)(a_{1j}, ...,a_{mj})^T
A(ej)=(η1,...,ηm)(a1j,...,amj)T共考虑n个原像向量,则
A
=
(
a
11
.
.
.
a
1
n
.
.
.
.
.
.
a
m
1
.
.
.
a
m
n
)
\bm{A} = \left( \begin{matrix}a_{11} & ... & a_{1n} \\ ...&&...\\a_{m1} &...& a_{mn} \end{matrix} \right )
A=⎝⎛a11...am1......a1n...amn⎠⎞则称矩阵
A
\bm{A}
A为映射
A
\bm{A}
A的矩阵表示,有
A
(
(
e
1
,
.
.
.
,
e
n
)
)
=
(
η
1
,
.
.
.
,
η
m
)
A
\bm{A}((\bm{e}_1, ..., \bm{e}_n)) = (\bm{η}_1, ..., \bm{η}_m)\bm{A}
A((e1,...,en))=(η1,...,ηm)A对于入口基坐标下的
x
\bm{x}
x,其映射在出口基的坐标为
A
x
\bm{A}\bm{x}
Ax,即
A
(
x
)
=
A
(
(
e
1
,
.
.
.
,
e
n
)
x
)
=
(
A
(
e
1
)
,
.
.
.
,
A
(
e
n
)
)
x
=
(
η
1
,
.
.
.
,
η
m
)
A
x
=
(
η
1
,
.
.
.
,
η
m
)
(
A
x
)
\begin{aligned} \bm{A}(\bm{x}) &= \bm{A}((\bm{e}_1, ..., \bm{e}_n)\bm{x}) \\ &= (\bm{A}(\bm{e}_1), ..., \bm{A}(\bm{e}_n))\bm{x} \\ &= (\bm{η}_1, ..., \bm{η}_m)\bm{A}\bm{x} \\&= (\bm{η}_1, ..., \bm{η}_m)(\bm{A}\bm{x}) \end{aligned}
A(x)=A((e1,...,en)x)=(A(e1),...,A(en))x=(η1,...,ηm)Ax=(η1,...,ηm)(Ax) 考虑矩阵分析表示几何空间的旋转,其角度为
θ
θ
θ,其出口基与入口基均是3维空间,将轴的正向定义为
e
3
\bm{e}_3
e3,其他为
e
1
,
e
2
\bm{e}_1, \bm{e}_2
e1,e2,则旋转映射
B
=
(
e
1
,
e
2
,
e
3
)
(
c
o
s
(
θ
)
−
s
i
n
(
θ
)
0
s
i
n
(
θ
)
c
o
s
(
θ
)
0
0
0
1
)
\bm{B} = (\bm{e}_1, \bm{e}_2, \bm{e}_3)\left( \begin{matrix}cos(θ) & -sin(θ) & 0 \\ sin(θ) & cos(θ) & 0 \\0 &0& 1 \end{matrix} \right )
B=(e1,e2,e3)⎝⎛cos(θ)sin(θ)0−sin(θ)cos(θ)0001⎠⎞ 考虑矩阵论表示几何空间的反射,将镜面的正法向定义为
e
3
\bm{e}_3
e3,其他为
e
1
,
e
2
\bm{e}_1, \bm{e}_2
e1,e2,则镜面映射
C
=
(
e
1
,
e
2
,
e
3
)
(
1
0
0
0
1
0
0
0
−
1
)
\bm{C} = (\bm{e}_1, \bm{e}_2, \bm{e}_3)\left( \begin{matrix}1 & 0 & 0 \\ 0 & 1 & 0 \\0 &0& -1 \end{matrix} \right )
C=(e1,e2,e3)⎝⎛10001000−1⎠⎞
六、矩阵等价与相似
对于
A
,
B
∈
F
m
×
n
\bm{A}, \bm{B}\in\bm{F}^{m×n}
A,B∈Fm×n,存在可逆矩阵
P
∈
F
n
×
n
\bm{P}\in\bm{F}^{n×n}
P∈Fn×n与
Q
∈
F
m
×
m
\bm{Q}\in\bm{F}^{m×m}
Q∈Fm×m,使得
A
P
=
Q
B
\bm{A}\bm{P}=\bm{Q}\bm{B}
AP=QB则称
A
\bm{A}
A与
B
\bm{B}
B等价。在线性代数中,等价描述为
T
A
S
=
B
\bm{T}\bm{A}\bm{S}=\bm{B}
TAS=B,以刻画初等行列变换,即
A
\bm{A}
A可由初等变换得到
B
\bm{B}
B。而从矩阵分析考虑,有
A
(
P
1
,
.
.
.
,
P
n
)
=
(
Q
1
,
.
.
.
,
Q
m
)
B
\bm{A}(\bm{P}_1, ...,\bm{P}_n) = (\bm{Q}_1, ...,\bm{Q}_m)\bm{B}
A(P1,...,Pn)=(Q1,...,Qm)B将矩阵
A
\bm{A}
A视为线性映射
A
:
x
↦
y
=
A
x
\bm{A}:\bm{x}\mapsto\bm{y} = \bm{A}\bm{x}
A:x↦y=Ax,满秩矩阵
P
\bm{P}
P的列向量为n维空间的一般基,满秩矩阵
Q
\bm{Q}
Q的列向量为m维空间的一般基,则有线性映射
A
\bm{A}
A在入口基
P
\bm{P}
P与出口基
Q
\bm{Q}
Q下的矩阵表示是
B
\bm{B}
B。
考虑选择基以最简表示,即
A
P
=
Q
(
I
r
0
0
0
)
\bm{A}\bm{P} = \bm{Q}\left( \begin{matrix}\bm{I}_r & \bm{0} \\ \bm{0} & \bm{0} \end{matrix} \right )
AP=Q(Ir000)有
A
P
1
=
Q
1
.
.
.
A
P
r
=
Q
r
A
P
r
+
1
=
0
.
.
.
A
P
n
=
0
\bm{A}\bm{P}_1 = \bm{Q_1} \\ ... \\ \bm{A}\bm{P}_r = \bm{Q_r} \\ \bm{A}\bm{P}_{r+1} = \bm{0}\\... \\ \bm{A}\bm{P}_n = \bm{0}
AP1=Q1...APr=QrAPr+1=0...APn=0在标准基
I
n
\bm{I}_n
In与
I
m
\bm{I}_m
Im下,
A
:
x
↦
y
=
A
x
\bm{A}:\bm{x} \mapsto \bm{y} = \bm{Ax}
A:x↦y=Ax;但在基
P
\bm{P}
P与
Q
\bm{Q}
Q下,
B
:
x
′
↦
y
′
=
B
x
′
\bm{B}:\bm{x}' \mapsto \bm{y}' = \bm{Bx}'
B:x′↦y′=Bx′,其中
B
\bm{B}
B是最简表示,则有
y
1
′
=
x
1
′
.
.
.
y
r
′
=
x
r
′
y
r
+
1
′
=
0
.
.
.
y
m
′
=
0
\bm{y}'_1 =\bm{x}'_1\\ ...\\ \bm{y}'_r =\bm{x}'_r\\ \bm{y}'_{r+1} = \bm{0}\\ ...\\ \bm{y}'_{m} = \bm{0}
y1′=x1′...yr′=xr′yr+1′=0...ym′=0使得分量完全解耦。
对于
A
,
B
∈
F
n
×
n
\bm{A}, \bm{B}\in\bm{F}^{n×n}
A,B∈Fn×n,若存在n阶可逆矩阵
P
\bm{P}
P使得
A
P
=
P
B
\bm{AP} = \bm{PB}
AP=PB则称
A
\bm{A}
A与
B
\bm{B}
B相似。将矩阵
A
\bm{A}
A视为线性变换
A
:
x
↦
y
=
A
x
\bm{A}:\bm{x}\mapsto\bm{y} = \bm{A}\bm{x}
A:x↦y=Ax,满秩矩阵
P
\bm{P}
P的列向量为n维空间的一般基,则有线性变换
A
\bm{A}
A在入口基与出口基
P
\bm{P}
P下的矩阵表示是
B
\bm{B}
B。
首先定义方阵的不变子空间,若
A
∈
F
n
×
n
\bm{A}\in\bm{F}^{n×n}
A∈Fn×n,
W
∈
F
n
\bm{W}\in\bm{F}^n
W∈Fn是
F
n
\bm{F}^n
Fn的子空间,若
A
(
W
)
⊆
W
\bm{A}(\bm{W}) \subseteq \bm{W}
A(W)⊆W,则称
W
\bm{W}
W是
A
\bm{A}
A的不变子空间。
考虑不变子空间与相似最简化的等价性,对于
A
P
=
P
B
\bm{AP} = \bm{PB}
AP=PB,令
P
=
(
P
1
,
P
2
)
\bm{P} = (\bm{P}_1, \bm{P}_2)
P=(P1,P2),相应的,
B
=
(
B
11
B
12
B
21
B
22
)
\bm{B} = \left( \begin{matrix}\bm{B}_{11} & \bm{B}_{12} \\ \bm{B}_{21} & \bm{B}_{22} \end{matrix} \right )
B=(B11B21B12B22)有
B
21
=
0
\bm{B}_{21} = \bm{0}
B21=0,则
i
m
P
1
im\bm{P}_1
imP1是
A
\bm{A}
A的不变子空间,而
B
12
=
0
\bm{B}_{12} = \bm{0}
B12=0,则
i
m
P
2
im\bm{P}_2
imP2是
A
\bm{A}
A的不变子空间。证明如下
A
P
1
=
(
P
1
,
P
2
)
(
B
11
,
B
21
)
T
A
P
2
=
(
P
1
,
P
2
)
(
B
12
,
B
22
)
T
\bm{AP}_1 = (\bm{P}_1, \bm{P}_2)(\bm{B}_{11}, \bm{B}_{21})^T \\ \bm{AP}_2 = (\bm{P}_1, \bm{P}_2)(\bm{B}_{12}, \bm{B}_{22})^T
AP1=(P1,P2)(B11,B21)TAP2=(P1,P2)(B12,B22)T要证,
i
m
P
1
im\bm{P}_1
imP1是
A
\bm{A}
A的不变子空间,则
A
i
m
P
1
⊆
i
m
P
1
\bm{A}im\bm{P}_1 \subseteq im\bm{P}_1
AimP1⊆imP1,其中
i
m
P
1
im \bm{P}_1
imP1是
P
1
\bm{P}_1
P1列向量的线性组合。当
B
21
=
0
\bm{B}_{21} = \bm{0}
B21=0,有
A
P
1
=
(
p
1
,
.
.
.
,
p
n
)
B
=
P
1
B
,
A
p
j
∈
i
m
P
1
,
j
=
1
,
.
.
.
,
n
\bm{AP}_1 = (\bm{p}_1, ... , \bm{p}_n)\bm{B}= \bm{P}_1\bm{B}, \bm{Ap}_j \in im \bm{P}_1, j = 1, ..., n
AP1=(p1,...,pn)B=P1B,Apj∈imP1,j=1,...,n显然成立。
B
12
=
0
\bm{B}_{12} = \bm{0}
B12=0同理。
反之,若有不变子空间,就一定有可以三角化的矩阵。考虑
A
\bm{A}
A的不变子空间
W
=
s
p
a
n
{
v
1
,
.
.
.
,
v
t
}
\bm{W} = span\{\bm{v}_1, ... , \bm{v}_t\}
W=span{v1,...,vt},则有可逆矩阵
P
\bm{P}
P使得
A
\bm{A}
A三角化为
B
\bm{B}
B,即
P
1
=
(
v
1
,
.
.
.
,
v
t
)
,
P
2
=
(
u
1
,
.
.
.
,
u
n
−
t
)
\bm{P}_1 = (\bm{v}_1, ... , \bm{v}_t), \bm{P}_2 = (\bm{u}_1, ... , \bm{u}_{n - t})
P1=(v1,...,vt),P2=(u1,...,un−t)记
P
=
(
P
1
,
P
2
)
\bm{P} = (\bm{P}_1, \bm{P}_2)
P=(P1,P2),则
A
P
\bm{A}\bm{P}
AP就是一个三角矩阵。其中
P
2
\bm{P}_2
P2是一个扩充矩阵,其使得
P
\bm{P}
P是一个可逆方阵。
考虑相似对角化的条件。取
A
P
=
P
Λ
\bm{AP} = \bm{PΛ}
AP=PΛ,则
P
\bm{P}
P的每一维度向量张成的空间
i
m
p
j
im\bm{p}_j
impj都是
A
\bm{A}
A的不变子空间。由此,定义特征值与特征向量,考虑
A
p
=
p
λ
\bm{Ap} = \bm{p}λ
Ap=pλ,则称
λ
λ
λ是矩阵的一个特征值,而
p
\bm{p}
p是其相应的一个特征向量。其意义为一维不变子空间的映射仍在该子空间,即一维向量的线性组合。那么,
P
\bm{P}
P的每一维度向量张成的空间
i
m
p
j
im\bm{p}_j
impj都是
A
\bm{A}
A的不变子空间,等效为
A
\bm{A}
A可以相似,等价于存在有n个线性无关的向量。