向量组的秩
定义2.1:考虑 m m m个 n n n维列向量 α i ∈ R n ( i = 1 , 2 , . . . , m ) {\alpha}_i\in R^n(i=1,2,...,m) αi∈Rn(i=1,2,...,m)构成的向量组 T = { α 1 ⃗ , α 2 ⃗ , . . . , α m ⃗ } \bold T=\{\vec{\alpha_1},\vec{\alpha_2},...,\vec{\alpha_m}\} T={α1,α2,...,αm},将其极大线性无关组所包含的列向量个数 k k k称作该向量组的秩,记作 r ( T ) = k r(\bold T)=k r(T)=k。类似的,同样可以定义行向量组的秩。
定义2.2:若向量组
T
\bold T
T的子集
{
α
1
⃗
,
α
2
⃗
,
.
.
.
,
α
k
⃗
}
\{\vec{\alpha_1},\vec{\alpha_2},...,\vec{\alpha_k}\}
{α1,α2,...,αk}满足:
(1)
α
1
⃗
,
α
2
⃗
,
.
.
.
,
α
k
⃗
\vec{\alpha_1},\vec{\alpha_2},...,\vec{\alpha_k}
α1,α2,...,αk线性无关;
(2)
T
\bold T
T中任何向量均可由
α
1
⃗
,
α
2
⃗
,
.
.
.
,
α
k
⃗
\vec{\alpha_1},\vec{\alpha_2},...,\vec{\alpha_k}
α1,α2,...,αk进行线性表示。
则将
{
α
1
⃗
,
α
2
⃗
,
.
.
.
,
α
k
⃗
}
\{\vec{\alpha_1},\vec{\alpha_2},...,\vec{\alpha_k}\}
{α1,α2,...,αk}称作
T
\bold T
T的一个极大线性无关组。
定义2.3:若两向量组可互相线性表示则称二者等价。
向量组的极大线性无关组是与原向量组等价的线性无关组。
Remark:一个向量组的极大线性无关组可能不是唯一的,但这些不同的极大线性无关组包含的向量个数是相同的,即向量组的秩是一个确定的数值。关于该点的说明需要应用到定理2.1
定理2.1:对于 R n R^n Rn中的两个行/列向量组 T 1 = { α 1 ⃗ , α 2 ⃗ , . . . , α p ⃗ } \bold {T_1}=\{\vec{\alpha_1},\vec{\alpha_2},...,\vec{\alpha_p}\} T1={α1,α2,...,αp}、 T 2 = { β 1 ⃗ , β 2 ⃗ , \bold {T_2}=\{\vec{\beta_1},\vec{\beta_2}, T2={β1,β2, . . . , β q ⃗ } ...,\vec{\beta_q}\} ...,βq},若 T 1 \bold {T_1} T1可由 T 2 \bold {T_2} T2线性表示且 p > q p>q p>q,则 T 1 \bold {T_1} T1向量组线性相关。
Remark:可由同维的向量数目更少的向量组 T 2 \bold {T_2} T2进行线性表示的向量组 T 1 \bold {T_1} T1是线性相关的。
通过定理2.1即可得到如下推论:
推论2.1:若行/列向量组
T
1
\bold {T_1}
T1(含
p
p
p个向量)可由向量组
T
2
\bold {T_2}
T2(含
q
q
q个向量)线性得到,且
T
1
\bold {T_1}
T1线性无关,则
p
≤
q
p\le q
p≤q.(定理2.1的逆否命题)
推论2.2:两等价的线性无关行/列向量组秩相等.
证明:
\quad
假设
T
1
\bold {T_1}
T1含
p
p
p个向量,
T
2
\bold {T_2}
T2含
q
q
q个向量
\qquad
\quad
线性无关的
T
1
\bold {T_1}
T1可由
T
2
\bold {T_2}
T2线性表示
⟹
p
≤
q
\Longrightarrow p\le q
⟹p≤q
\qquad
\quad
线性无关的
T
2
\bold {T_2}
T2可由
T
1
\bold {T_1}
T1线性表示
⟹
q
≤
p
\Longrightarrow q\le p
⟹q≤p
\qquad
\quad
综上,
p
=
q
p=q
p=q,即
T
1
\bold {T_1}
T1,
T
2
\bold {T_2}
T2秩相等.(证毕)
由等价的传递性及推论2.2可知一个向量组的秩为一个特定值.现对定理2.1进行证明:
证明:
\quad
T
1
\bold {T_1}
T1可由
T
2
\bold {T_2}
T2线性表示
⟺
T
1
=
T
2
K
q
×
p
\Longleftrightarrow \bold {T_1}=\bold {T_2} \bold {K_{q\times p}}
⟺T1=T2Kq×p
\qquad
\quad
T
1
\bold {T_1}
T1线性相关
⟹
∃
x
⃗
≠
0
,
s
.
t
.
T
1
x
⃗
=
T
2
K
x
⃗
=
0
(
x
⃗
∈
R
p
)
\Longrightarrow \exists \vec{x}\ne0,s.t.\ \bold {T_1}\vec{x}=\bold {T_2} \bold K\vec{x}=0\ (\vec{x}\in R^p)
⟹∃x=0,s.t. T1x=T2Kx=0 (x∈Rp)
\qquad
\quad
若能找到使
K
x
⃗
=
0
\bold K\vec{x}=0
Kx=0成立的非零向量
x
⃗
\vec{x}
x,显然
T
1
\bold {T_1}
T1线性相关得证.
\qquad
\quad
为方便观察得到满足要求的
x
⃗
\vec{x}
x,可对
K
\bold K
K进行初等行变换,即:
\qquad
\quad
\qquad
\quad
\qquad
\quad
P
K
=
U
⟹
U
x
⃗
=
0
\bold {PK}=\bold U\Longrightarrow \bold U \vec{x}=0
PK=U⟹Ux=0
\qquad
\quad
其中,
P
\bold P
P为可逆矩阵,
U
\bold U
U为
K
\bold K
K的行标准型,且
U
=
[
U
1
0
]
\bold U=\begin{bmatrix} \bold {U_1}\\ \bold 0 \end{bmatrix}
U=[U10].
\qquad
\quad
若
r
(
K
)
=
l
≤
q
<
p
r(\bold K)=l\le q<p
r(K)=l≤q<p,则
U
1
\bold {U_1}
U1为含
l
l
l个
l
l
l维单位列向量的
l
×
p
l\times p
l×p维矩阵.
\qquad
\quad
不妨取
U
1
=
{
e
1
⃗
,
e
2
⃗
,
.
.
.
,
e
l
⃗
,
α
⃗
l
+
1
,
α
⃗
l
+
2
,
.
.
.
,
,
α
⃗
p
}
\bold {U_1}=\{\vec{e_1},\vec{e_2},...,\vec{e_l},\vec{\alpha}_{l+1},\vec{\alpha}_{l+2},...,,\vec{\alpha}_{p}\}
U1={e1,e2,...,el,αl+1,αl+2,...,,αp}
\qquad
\quad
\qquad
\quad
\qquad
\quad
U
x
⃗
=
[
U
1
x
⃗
0
]
=
0
⟹
U
1
x
⃗
=
0
\bold U \vec{x}=\begin{bmatrix} \bold {U_1}\vec{x}\\ \bold 0 \end{bmatrix}=0\Longrightarrow \bold {U_1}\vec{x}=0
Ux=[U1x0]=0⟹U1x=0
\qquad
\quad
(1)若
α
⃗
l
+
2
,
.
.
.
,
,
α
⃗
p
\vec{\alpha}_{l+2},...,,\vec{\alpha}_{p}
αl+2,...,,αp中含零向量(比如
α
⃗
j
\vec{\alpha}_{j}
αj),则取
x
⃗
=
[
0
,
.
.
.
,
0
⏟
l
,
0
,
.
.
.
\vec{x}=[\underbrace{0,...,0}_l,0,...
x=[l
0,...,0,0,...
\qquad
\quad
,
r
j
,
.
.
.
,
0
p
]
,
r
\underset{j}{r},...,\underset{p}{0}],r
jr,...,p0],r为任意非零实数,即可满足非零的要求;
\qquad
\quad
(2)若
α
⃗
l
+
2
,
.
.
.
,
,
α
⃗
p
\vec{\alpha}_{l+2},...,,\vec{\alpha}_{p}
αl+2,...,,αp中不含零向量,设
α
⃗
j
=
[
d
1
j
,
d
2
j
,
.
.
.
,
d
l
j
]
T
\vec{\alpha}_{j}=[d_{1j},d_{2j},...,d_{lj}]^T
αj=[d1j,d2j,...,dlj]T,此时,
\qquad
\quad
不妨取
x
⃗
=
[
d
1
j
,
d
2
j
,
.
.
.
,
d
l
j
⏟
l
,
0
,
.
.
.
,
0
,
−
1
j
,
0
,
.
.
.
,
0
p
]
\vec{x}=[\underbrace{d_{1j},d_{2j},...,d_{lj}}_l,0,...,0,\underset{j}{-1},0,...,\underset{p}{0}]
x=[l
d1j,d2j,...,dlj,0,...,0,j−1,0,...,p0]即可满足要求.
\qquad
\quad
综上,总可以找到非零的
x
⃗
\vec{x}
x使得
T
1
x
⃗
=
0
\bold {T_1}\vec{x}=0
T1x=0成立,即
T
1
\bold {T_1}
T1线性相关.此外该
\qquad
\quad
定理对于行向量组显然也同样成立.(证毕)
Remark:类似的,当 p ≤ q p\le q p≤q且 r ( K ) = l < p r(\bold K)=l <p r(K)=l<p 时同样可找到非零的 x ⃗ \vec{x} x使得 T 1 x ⃗ = 0 \bold {T_1}\vec{x}=0 T1x=0成立,但 l = p l=p l=p 时却无法找到非零的 x ⃗ \vec{x} x,只有在 q < p q< p q<p 时才恒有 r ( K ) = l < p r(\bold K)=l <p r(K)=l<p。
定理2.2:
(1) 对列(行)向量组进行初等列(行)变换不影响列(行)向量组的秩,但变换后的列(行)向量组线性组合系数并不同于原列(行)向量组;
(2) 对列(行)向量组进行初等行(列)变换不改变列(行)向量组的秩与线性组合系数。
证明:(1)设列向量组
T
1
:
{
α
⃗
1
,
α
⃗
2
,
…
,
α
⃗
p
}
\bold{T_1}:\{\vec{\alpha}_1,\vec{\alpha}_2,\dots,\vec{\alpha}_p\}
T1:{α1,α2,…,αp}线性相关,则存在不全为零的
x
i
(
i
=
1
,
2
,
…
,
p
)
x_i(i=1,2,\dots,p)
xi(i=1,2,…,p)使得
\qquad\qquad \qquad \qquad \quad
x
1
α
⃗
1
+
x
2
α
⃗
2
+
⋯
+
x
p
α
⃗
p
=
0
x_1 \vec{\alpha}_1+x_2 \vec{\alpha}_2+ \dots +x_p \vec{\alpha}_p=0
x1α1+x2α2+⋯+xpαp=0
\qquad\ \ \ \quad
设经过一次初等列变换,向量组变为
T
2
:
{
β
⃗
1
,
β
⃗
2
,
…
,
β
⃗
p
}
\bold{T_2}:\{\vec{\beta}_1,\vec{\beta}_2,\dots,\vec{\beta}_p\}
T2:{β1,β2,…,βp}.
\qquad\ \ \ \quad
a. 若采用交换任意两列向量的次序,则:
\qquad \qquad \quad
{
β
⃗
1
,
β
⃗
2
,
…
,
β
⃗
i
,
…
,
β
⃗
j
,
…
,
β
⃗
p
}
=
{
α
⃗
1
,
α
⃗
2
,
…
,
α
⃗
j
,
…
,
α
⃗
i
,
…
,
α
⃗
p
}
\{\vec{\beta}_1,\vec{\beta}_2,\dots,\vec{\beta}_i,\dots,\vec{\beta}_j,\dots,\vec{\beta}_p\}=\{\vec{\alpha}_1,\vec{\alpha}_2,\dots,\vec{\alpha}_j,\dots,\vec{\alpha}_i,\dots,\vec{\alpha}_p\}
{β1,β2,…,βi,…,βj,…,βp}={α1,α2,…,αj,…,αi,…,αp}
\qquad\ \ \ \quad
此时,有
\qquad \qquad \quad
x
1
β
⃗
1
+
⋯
+
x
i
−
1
β
⃗
i
−
1
+
x
j
β
⃗
i
+
x
i
+
1
β
⃗
i
+
1
+
⋯
+
x
i
β
⃗
j
+
⋯
+
x
p
β
⃗
p
=
0
x_1 \vec{\beta}_1+ \dots +x_{i-1} \vec{\beta}_{i-1}+x_j \vec{\beta}_i+x_{i+1} \vec{\beta}_{i+1}+\dots+x_i \vec{\beta}_j+\dots+x_p \vec{\beta}_p=0
x1β1+⋯+xi−1βi−1+xjβi+xi+1βi+1+⋯+xiβj+⋯+xpβp=0
\qquad\ \ \ \quad
b. 若采用非零数
k
k
k乘任意列向量,则:
\qquad \qquad \quad
{
β
⃗
1
,
β
⃗
2
,
…
,
β
⃗
i
,
…
,
β
⃗
p
}
=
{
α
⃗
1
,
α
⃗
2
,
…
,
k
α
⃗
i
,
…
,
α
⃗
p
}
\{\vec{\beta}_1,\vec{\beta}_2,\dots,\vec{\beta}_i,\dots,\vec{\beta}_p\}=\{\vec{\alpha}_1,\vec{\alpha}_2,\dots,k\vec{\alpha}_i,\dots,\vec{\alpha}_p\}
{β1,β2,…,βi,…,βp}={α1,α2,…,kαi,…,αp}
\qquad\ \ \ \quad
此时,有
\qquad \qquad \quad
x
1
β
⃗
1
+
⋯
+
x
i
−
1
β
⃗
i
−
1
+
x
i
k
β
⃗
i
+
x
i
+
1
β
⃗
i
+
1
+
⋯
+
x
p
β
⃗
p
=
0
x_1 \vec{\beta}_1+ \dots +x_{i-1} \vec{\beta}_{i-1}+\frac{x_i}{k} \vec{\beta}_i+x_{i+1} \vec{\beta}_{i+1}+\dots+x_p \vec{\beta}_p=0
x1β1+⋯+xi−1βi−1+kxiβi+xi+1βi+1+⋯+xpβp=0
\qquad\ \ \ \quad
c. 若采用某列向量的倍数加至另一列向量,则:
\qquad \qquad \quad
{
β
⃗
1
,
β
⃗
2
,
…
,
β
⃗
i
,
…
,
β
⃗
j
,
…
,
β
⃗
p
}
=
{
α
⃗
1
,
α
⃗
2
,
…
,
α
⃗
i
,
…
,
α
⃗
j
+
k
α
⃗
i
,
…
,
α
⃗
p
}
\{\vec{\beta}_1,\vec{\beta}_2,\dots,\vec{\beta}_i,\dots,\vec{\beta}_j,\dots,\vec{\beta}_p\}=\{\vec{\alpha}_1,\vec{\alpha}_2,\dots,\vec{\alpha}_i,\dots,\vec{\alpha}_j+k\vec{\alpha}_i,\dots,\vec{\alpha}_p\}
{β1,β2,…,βi,…,βj,…,βp}={α1,α2,…,αi,…,αj+kαi,…,αp}
\qquad\ \ \ \quad
此时,有
\qquad \qquad \quad
x
1
β
⃗
1
+
⋯
+
x
i
−
1
β
⃗
i
−
1
+
(
x
i
−
k
x
j
)
β
⃗
i
+
⋯
+
x
j
β
⃗
j
+
⋯
+
x
p
β
⃗
p
=
0
x_1 \vec{\beta}_1+ \dots +x_{i-1} \vec{\beta}_{i-1}+(x_i-kx_j)\vec{\beta}_i+\dots+x_j \vec{\beta}_j+\dots+x_p \vec{\beta}_p=0
x1β1+⋯+xi−1βi−1+(xi−kxj)βi+⋯+xjβj+⋯+xpβp=0
\qquad\ \ \ \quad
且新的组合系数同样不会同时为零,那么
T
2
\bold{T_2}
T2线性相关。
\qquad\ \ \ \quad
反过来,若
T
2
\bold{T_2}
T2线性相关也能得到
T
1
\bold{T_1}
T1线性相关,即
\qquad \qquad \quad
T
1
\bold{T_1}
T1线性相关
⟺
\Longleftrightarrow
⟺
T
2
\bold{T_2}
T2线性相关
\qquad\ \ \ \quad
则,对列向量组进行初等列变换不影响列向量组的线性相关性,不过显然组合系数有所改变
\ \qquad
(2) 设列向量组构成的矩阵
T
1
=
[
α
⃗
1
,
α
⃗
2
,
…
,
α
⃗
p
]
\bold{T_1}=[\vec{\alpha}_1,\vec{\alpha}_2,\dots,\vec{\alpha}_p]
T1=[α1,α2,…,αp]经过初等行变换为
T
2
=
[
β
⃗
1
,
β
⃗
2
,
…
,
β
p
⃗
]
\bold{T_2}=[\vec{\beta}_1,\vec{\beta}_2,\dots,\vec{\beta_p}]
T2=[β1,β2,…,βp].
\qquad\ \ \ \quad
则,
R
n
T
1
=
T
2
\bold{R_nT_1=T_2}
RnT1=T2,其中
R
\bold R
R 为可逆矩阵,
n
n
n为方阵
R
\bold R
R的阶数 。
\qquad\ \ \ \quad
从而有:
R
α
i
⃗
=
β
i
⃗
i
=
1
,
2
,
…
,
p
\bold{R}\vec{\alpha_i} = \vec{\beta_i} \qquad i=1,2,\dots,p
Rαi=βii=1,2,…,p
\qquad\ \ \ \quad
a
.
a.
a.若
T
1
\bold{T_1}
T1线性相关,则存在不全为零的组合系数
k
i
k_i
ki使得
k
i
α
i
⃗
=
0
k_i \vec{\alpha_i}=0
kiαi=0(爱因斯坦求和约定)
\qquad\ \ \ \quad \quad
⟹
\Longrightarrow
⟹
k
i
R
α
i
⃗
=
k
i
β
i
⃗
=
0
k_i \bold{R}\vec{\alpha_i}=k_i \vec{\beta_i}=0
kiRαi=kiβi=0
\qquad\ \ \ \quad
b
.
b.
b.若
T
2
\bold{T_2}
T2线性相关,则存在不全为零的组合系数
s
i
s_i
si使得
s
i
β
i
⃗
=
0
s_i \vec{\beta_i}=0
siβi=0(爱因斯坦求和约定)
\qquad\ \ \ \quad \quad
⟹
\Longrightarrow
⟹
s
i
R
−
1
β
i
⃗
=
s
i
α
i
⃗
=
0
s_i \bold{R^{-1}}\vec{\beta_i}=s_i \vec{\alpha_i}=0
siR−1βi=siαi=0
\qquad\ \ \ \quad
则,
T
1
\bold{T_1}
T1线性相关
⟺
\Longleftrightarrow
⟺
T
2
\bold{T_2}
T2线性相关。
\qquad\ \ \ \quad
即,对列向量组进行初等行变换不影响列向量组的线性相关性,且二者线性组合系数相同。
\qquad\ \ \ \quad
行向量组
T
1
T_1
T1构成的矩阵进行转置即得到对应的列向量组
T
2
T_2
T2,则
T
1
T_1
T1,
T
2
T_2
T2线性组合关系相同,且
\qquad\ \ \ \quad
对应系数相等。
\qquad\ \ \ \quad
(1)对
T
2
T_2
T2进行初等列变换相当于对
T
1
T_1
T1进行初等行变换得到
T
3
T_3
T3,则
T
2
,
T
3
T_2,T_3
T2,T3线性关系相同但组合
\qquad\ \ \quad \quad
系数不同。
\qquad\ \ \ \quad
(2)对
T
2
T_2
T2进行初等行变换相当于对
T
1
T_1
T1进行初等列变换得到
T
3
T_3
T3,则
T
2
,
T
3
T_2,T_3
T2,T3线性关系相同且组合
\qquad\ \ \quad \quad
系数相同。
定理2.3:矩阵
A
m
×
n
\bold A_{m\times n}
Am×n的秩等于矩阵
A
\bold A
A的列(行)向量组的秩。
证明:设
r
(
A
)
=
r
r(\bold A)=r
r(A)=r,利用初等行变换,将矩阵
A
\bold A
A化为行标准型:
\quad \ \ \quad
A
=
[
α
⃗
1
,
α
⃗
2
,
…
,
α
⃗
n
]
⟼
B
=
[
β
⃗
1
,
β
⃗
2
,
…
,
β
n
⃗
]
\bold{A}=[\vec{\alpha}_1,\vec{\alpha}_2,\dots,\vec{\alpha}_n] \longmapsto \bold{B}=[\vec{\beta}_1,\vec{\beta}_2,\dots,\vec{\beta_n}]
A=[α1,α2,…,αn]⟼B=[β1,β2,…,βn]
\quad \ \ \quad
则
r
(
B
)
=
r
(
A
)
=
r
<
m
i
n
{
m
,
n
}
r(\bold B)=r(\bold A)=r<min\{m,n\}
r(B)=r(A)=r<min{m,n};
B
\bold B
B中包含
r
r
r个
m
m
m维单位向量,且各
β
⃗
i
\vec{\beta}_i
βi至多只有前
r
r
r个分
\quad \ \ \quad
量不为零。
\quad \ \ \quad
故,
{
e
1
,
e
2
,
…
,
e
r
}
(
e
i
仅前
r
个分量不为零
)
\{e_1,e_2,\dots,e_r\}(e_i仅前r个分量不为零)
{e1,e2,…,er}(ei仅前r个分量不为零)为矩阵
B
\bold B
B列向量的极大线性无关组。
\quad \ \ \quad
那么,
r
(
{
β
⃗
1
,
β
⃗
2
,
…
,
β
n
⃗
}
)
=
r
=
r
(
B
)
r(\{\vec{\beta}_1,\vec{\beta}_2,\dots,\vec{\beta_n}\})=r=r(\bold B)
r({β1,β2,…,βn})=r=r(B)
\quad \ \ \quad
由于,矩阵秩与列向量组的秩均不受初等行变换的影响,
\quad \ \ \quad
故,
r
(
{
α
⃗
1
,
α
⃗
2
,
…
,
α
⃗
n
}
)
=
r
(
A
)
r(\{\vec{\alpha}_1,\vec{\alpha}_2,\dots,\vec{\alpha}_n\})=r(\bold A)
r({α1,α2,…,αn})=r(A)
\quad \ \ \quad
由于
r
(
A
)
=
r
(
A
T
)
r(\bold A)=r(\bold{A^T})
r(A)=r(AT),则对
A
T
\bold {A^T}
AT的重复上述证明即可得知:行向量组的秩等于矩阵的秩。
推论2.3: n n n阶方阵可逆 ⟺ r ( A ) = n \Longleftrightarrow r(\bold A)=n ⟺r(A)=n ⟺ \Longleftrightarrow ⟺行(列)向量组线性无关 ⟺ d e t ( A ) ≠ 0 \Longleftrightarrow det(\bold A)\ne 0 ⟺det(A)=0
定理2.4:若向量组的秩为 r r r则向量组中任意 r r r个线性无关的向量构成向量组的极大线性无关组。
证明:(反证法),若
r
r
r个线性无关的向量不构成向量组的极大线性无关组
\quad \ \ \quad
则向量组中应至少存在某个向量不能由其它向量线性组合而成
\quad \ \ \quad
可得到
r
+
1
r+1
r+1个线性无关向量构成的向量组,
\quad \ \ \quad
说明向量组的秩应大于等于
r
+
1
r+1
r+1,与秩等于
r
r
r相违背。
定理2.5:设向量组
{
α
⃗
1
,
α
⃗
2
,
…
,
α
⃗
m
}
\{\vec{\alpha}_1,\vec{\alpha}_2,\dots,\vec{\alpha}_m\}
{α1,α2,…,αm}线性无关,但
{
α
⃗
1
,
α
⃗
2
,
…
,
α
⃗
m
,
β
}
\{\vec{\alpha}_1,\vec{\alpha}_2,\dots,\vec{\alpha}_m,\beta\}
{α1,α2,…,αm,β}线性相关,则
β
\beta
β可由向量组
{
α
⃗
1
,
α
⃗
2
,
…
,
α
⃗
m
}
\{\vec{\alpha}_1,\vec{\alpha}_2,\dots,\vec{\alpha}_m\}
{α1,α2,…,αm}唯一地进行线性表示。
证明:由于
{
α
⃗
1
,
α
⃗
2
,
…
,
α
⃗
m
,
β
}
\{\vec{\alpha}_1,\vec{\alpha}_2,\dots,\vec{\alpha}_m,\beta\}
{α1,α2,…,αm,β}线性相关,则
\quad \ \ \quad
∃
\exists
∃不全为零的
x
1
,
x
2
,
…
,
x
m
,
x
x_1,x_2,\dots,x_m,x
x1,x2,…,xm,x,使得
x
1
α
⃗
1
+
x
2
α
⃗
2
+
⋯
+
x
m
α
⃗
m
+
x
β
⃗
=
0
x_1\vec{\alpha}_1+x_2\vec{\alpha}_2+\dots+x_m\vec{\alpha}_m+x\vec{\beta}=0
x1α1+x2α2+⋯+xmαm+xβ=0
\quad \ \ \quad
且由于向量组
{
α
⃗
1
,
α
⃗
2
,
…
,
α
⃗
m
}
\{\vec{\alpha}_1,\vec{\alpha}_2,\dots,\vec{\alpha}_m\}
{α1,α2,…,αm}线性无关,则
x
≠
0
x\ne 0
x=0。
\quad \ \ \quad
那么,
β
⃗
=
x
1
x
α
⃗
1
+
x
2
x
α
⃗
2
+
⋯
+
x
m
x
α
⃗
m
\vec{\beta}=\frac{x_1}{x}\vec{\alpha}_1+\frac{x_2}{x}\vec{\alpha}_2+\dots+\frac{x_m}{x}\vec{\alpha}_m
β=xx1α1+xx2α2+⋯+xxmαm,故
β
\beta
β可由向量组
{
α
⃗
1
,
α
⃗
2
,
…
,
α
⃗
m
}
\{\vec{\alpha}_1,\vec{\alpha}_2,\dots,\vec{\alpha}_m\}
{α1,α2,…,αm}线性表示。
\quad \ \ \quad
下面证明线性组合系数的唯一性:
\quad \ \ \quad
若
β
⃗
=
s
1
α
⃗
1
+
s
2
α
⃗
2
+
⋯
+
s
m
α
⃗
m
(
1
)
\vec{\beta}=s_1\vec{\alpha}_1+s_2\vec{\alpha}_2+\dots+s_m\vec{\alpha}_m\quad (1)
β=s1α1+s2α2+⋯+smαm(1)
\quad \ \ \quad
且
β
⃗
=
t
1
α
⃗
1
+
t
2
α
⃗
2
+
⋯
+
t
m
α
⃗
m
(
2
)
\vec{\beta}=t_1\vec{\alpha}_1+t_2\vec{\alpha}_2+\dots+t_m\vec{\alpha}_m\quad (2)
β=t1α1+t2α2+⋯+tmαm(2)
\quad \ \ \quad
(
1
)
−
(
2
)
(1)-(2)
(1)−(2)得:
(
s
1
−
t
1
)
α
⃗
1
+
(
s
2
−
t
2
)
α
⃗
2
+
⋯
+
(
s
m
−
t
m
)
α
⃗
m
=
0
(s_1-t_1)\vec{\alpha}_1+(s_2-t_2)\vec{\alpha}_2+\dots+(s_m-t_m)\vec{\alpha}_m=0
(s1−t1)α1+(s2−t2)α2+⋯+(sm−tm)αm=0
\quad \ \ \quad
由于
{
α
⃗
1
,
α
⃗
2
,
…
,
α
⃗
m
}
\{\vec{\alpha}_1,\vec{\alpha}_2,\dots,\vec{\alpha}_m\}
{α1,α2,…,αm}线性无关,则
s
i
−
t
i
=
0
(
i
=
1
,
…
,
m
)
s_i-t_i=0\qquad (i=1,\dots,m)
si−ti=0(i=1,…,m)
\quad \ \ \quad
故,组合系数唯一。
定义2.3:向量组 { α ⃗ 1 , α ⃗ 2 , … , α ⃗ r } \{\vec{\alpha}_1,\vec{\alpha}_2,\dots,\vec{\alpha}_r\} {α1,α2,…,αr}中的向量两两正交则称该向量组为 正交向量组,若各向量两两正交且均为单位向量则称该向量组为 标准正交向量组(规范正交向量组)(链接: 正交-定义3.6)
定理2.6:不包含零向量的正交向量组
{
α
⃗
1
,
α
⃗
2
,
…
,
α
⃗
r
}
\{\vec{\alpha}_1,\vec{\alpha}_2,\dots,\vec{\alpha}_r\}
{α1,α2,…,αr}线性无关。
证明:做线性组合
k
1
α
⃗
1
+
k
2
α
⃗
2
+
⋯
+
k
r
α
⃗
r
=
0
k_1\vec{\alpha}_1+k_2\vec{\alpha}_2+\dots+k_r\vec{\alpha}_r=0
k1α1+k2α2+⋯+krαr=0
\quad \ \ \quad
由正交性
(
α
⃗
i
,
α
⃗
j
)
=
0
,
i
≠
j
(\vec{\alpha}_i,\vec{\alpha}_j)=0,i\ne j
(αi,αj)=0,i=j且
α
⃗
i
≠
0
\vec{\alpha}_i\ne 0
αi=0得,
k
i
(
α
⃗
i
,
α
⃗
i
)
=
0
;
(
α
⃗
i
,
α
⃗
i
)
≠
0
k_i(\vec{\alpha}_i,\vec{\alpha}_i)=0;(\vec{\alpha}_i,\vec{\alpha}_i)\ne0
ki(αi,αi)=0;(αi,αi)=0
\quad \ \ \quad
则组合系数
k
i
=
0
k_i=0
ki=0,故不含零向量的正交向量组线性无关。(证毕)
Remark:不含零向量的 n n n维正交组至多含有 n n n个向量。
定理2.7:若
r
<
n
r<n
r<n,则对不包含零向量的正交向量组
{
α
⃗
1
,
α
⃗
2
,
…
,
α
⃗
r
}
\{\vec{\alpha}_1,\vec{\alpha}_2,\dots,\vec{\alpha}_r\}
{α1,α2,…,αr}必存在非零向量
X
⃗
\vec{X}
X与该向量组正交。
证明:问题转变为说明方程
[
α
⃗
1
T
α
⃗
2
T
⋮
α
⃗
r
T
]
X
⃗
=
α
r
×
n
X
⃗
=
0
\begin{bmatrix}\vec{\alpha}_1^T\\\vec{\alpha}_2^T\\\vdots\\\vec{\alpha}_r^T\end{bmatrix}\vec{X}=\alpha_{r\times n}\vec{X}=0
⎣
⎡α1Tα2T⋮αrT⎦
⎤X=αr×nX=0非平凡解的存在性,又
\quad \ \ \quad
r
(
{
α
⃗
1
,
α
⃗
2
,
…
,
α
⃗
r
}
)
=
r
=
r
(
α
r
×
n
)
<
n
r(\{\vec{\alpha}_1,\vec{\alpha}_2,\dots,\vec{\alpha}_r\})=r=r(\alpha_{r\times n})<n
r({α1,α2,…,αr})=r=r(αr×n)<n,则
α
r
×
n
\alpha_{r\times n}
αr×n对应的列向量组线性相关.
\quad \ \ \quad
则
α
r
×
n
X
⃗
=
[
β
⃗
1
,
β
⃗
2
,
…
,
β
⃗
n
]
X
⃗
=
0
\alpha_{r\times n}\vec{X}=[\vec{\beta}_1,\vec{\beta}_2,\dots,\vec{\beta}_n]\vec{X}=0
αr×nX=[β1,β2,…,βn]X=0存在不全为零的组合系数。
\quad \ \ \quad
换而言之,存在非平凡解或非零向量
X
⃗
\vec{X}
X。(证毕)
定理2.8:(格拉姆-施密特<
G
r
a
m
Gram
Gram-
S
c
h
m
i
d
t
Schmidt
Schmidt>正交化方法)
\qquad \ \quad
采用如下公式可由
m
m
m个线性无关的
n
n
n维向量构成的向量组 得到
m
m
m个两两正交的向量构成的正交向量组 :
{
β
⃗
1
=
α
⃗
1
β
⃗
2
=
α
⃗
2
−
(
α
⃗
2
,
β
⃗
1
)
(
β
⃗
1
,
β
⃗
1
)
β
⃗
1
…
β
⃗
m
=
α
⃗
m
−
∑
i
=
1
k
−
1
(
α
m
,
β
⃗
i
)
(
β
⃗
i
,
β
⃗
i
)
β
⃗
i
\begin{cases} \vec{\beta}_1=\vec{\alpha}_1\\ \vec{\beta}_2=\vec{\alpha}_2-\frac{(\vec{\alpha}_2,\vec{\beta}_1)}{(\vec{\beta}_1,\vec{\beta}_1)}\vec{\beta}_1\\ \dots\\ \vec{\beta}_m=\vec{\alpha}_m-\sum_{i=1}^{k-1}\frac{(\alpha_m,\vec{\beta}_i)}{(\vec{\beta}_i,\vec{\beta}_i)}\vec{\beta}_i\end{cases}
⎩
⎨
⎧β1=α1β2=α2−(β1,β1)(α2,β1)β1…βm=αm−∑i=1k−1(βi,βi)(αm,βi)βi
Remark: 实际上,
[ β ⃗ 1 , β ⃗ 2 , … , β ⃗ m ] = [ α ⃗ 1 , α ⃗ 2 , … , α ⃗ m ] [ 1 c 2 , 1 c 3 , 1 … c m , 1 0 1 c 3 , 2 … c m , 2 0 0 1 … c m , 3 … 0 0 0 … 1 ] , 通过正交性确定系数 c i , j ( j < i ) [\vec{\beta}_1,\vec{\beta}_2,\dots,\vec{\beta}_m]=[\vec{\alpha}_1,\vec{\alpha}_2,\dots,\vec{\alpha}_m]\begin{bmatrix} 1\ c_{2,1}\ c_{3,1}\ \dots\ c_{m,1}\\ 0\ 1\quad c_{3,2}\ \dots\ c_{m,2}\\ 0\ 0\qquad1\dots\ c_{m,3}\\ \dots \\ 0\ 0\qquad0\ \dots\quad\ 1 \end{bmatrix},通过正交性确定系数c_{i,j}(j<i) [β1,β2,…,βm]=[α1,α2,…,αm]⎣ ⎡1 c2,1 c3,1 … cm,10 1c3,2 … cm,20 01… cm,3…0 00 … 1⎦ ⎤,通过正交性确定系数ci,j(j<i)
\qquad \qquad 显然正交向量组与原向量组等价。
定理2.9:若
A
m
\bold A_m
Am为正交矩阵,即
A
T
A
=
A
A
T
=
E
A^TA=AA^T=E
ATA=AAT=E 或
A
T
=
A
−
1
A^T=A^{-1}
AT=A−1,则
A
\bold A
A的行(列)向量组为标准正交向量组。
证明:设
A
=
[
α
⃗
1
,
α
⃗
2
,
…
,
α
⃗
m
]
A=[\vec{\alpha}_1,\vec{\alpha}_2,\dots,\vec{\alpha}_m]
A=[α1,α2,…,αm],则
\qquad \ \quad
A
T
A
=
[
α
⃗
1
T
α
⃗
2
T
⋮
α
⃗
m
T
]
[
α
⃗
1
,
α
⃗
2
,
…
,
α
⃗
m
]
=
[
α
⃗
1
T
α
⃗
1
α
⃗
1
T
α
⃗
2
…
α
⃗
1
T
α
⃗
m
α
⃗
2
T
α
⃗
1
α
⃗
2
T
α
⃗
2
…
α
⃗
2
T
α
⃗
m
⋮
α
⃗
m
T
α
⃗
1
α
⃗
m
T
α
⃗
2
…
α
⃗
m
T
α
⃗
m
]
=
E
A^TA=\begin{bmatrix}\vec{\alpha}_1^T\\\vec{\alpha}_2^T\\\vdots\\\vec{\alpha}_m^T\end{bmatrix}[\vec{\alpha}_1,\vec{\alpha}_2,\dots,\vec{\alpha}_m]=\begin{bmatrix}\vec{\alpha}_1^T\vec{\alpha}_1\ \vec{\alpha}_1^T\vec{\alpha}_2\ \dots\ \vec{\alpha}_1^T\vec{\alpha}_m\\ \vec{\alpha}_2^T\vec{\alpha}_1 \ \vec{\alpha}_2^T\vec{\alpha}_2\ \dots \ \vec{\alpha}_2^T\vec{\alpha}_m\\\vdots\\ \vec{\alpha}_m^T\vec{\alpha}_1 \ \vec{\alpha}_m^T\vec{\alpha}_2\ \dots \ \vec{\alpha}_m^T\vec{\alpha}_m\end{bmatrix}=E
ATA=⎣
⎡α1Tα2T⋮αmT⎦
⎤[α1,α2,…,αm]=⎣
⎡α1Tα1 α1Tα2 … α1Tαmα2Tα1 α2Tα2 … α2Tαm⋮αmTα1 αmTα2 … αmTαm⎦
⎤=E
\qquad \ \quad
即
(
α
⃗
i
,
α
⃗
j
)
=
{
0
(
i
≠
j
)
1
(
i
=
j
)
(\vec{\alpha}_i,\vec{\alpha}_j)=\begin{cases}0\qquad(i\ne j)\\1\qquad(i= j)\end{cases}
(αi,αj)={0(i=j)1(i=j)
\qquad \ \quad
故正交矩阵的列向量构成正交向量组。
\qquad \ \quad
设
A
=
[
β
⃗
1
β
⃗
2
⋮
β
⃗
m
]
A=\begin{bmatrix}\vec{\beta}_1\\\vec{\beta}_2\\\vdots\\\vec{\beta}_m\end{bmatrix}
A=⎣
⎡β1β2⋮βm⎦
⎤,则
\qquad \ \quad
A
A
T
=
[
β
⃗
1
β
⃗
2
⋮
β
⃗
m
]
[
β
⃗
1
T
,
β
⃗
2
T
,
…
,
β
⃗
m
T
]
=
[
β
⃗
1
β
⃗
1
T
β
⃗
1
β
⃗
2
T
…
β
⃗
1
β
⃗
m
T
β
⃗
2
β
⃗
1
T
β
⃗
2
β
⃗
2
T
…
β
⃗
2
β
⃗
m
T
⋮
β
⃗
m
β
⃗
1
T
β
⃗
m
β
⃗
2
T
…
β
⃗
m
β
⃗
m
T
]
=
E
AA^T=\begin{bmatrix}\vec{\beta}_1\\\vec{\beta}_2\\\vdots\\\vec{\beta}_m\end{bmatrix}[\vec{\beta}_1^T,\vec{\beta}_2^T,\dots,\vec{\beta}_m^T]=\begin{bmatrix}\vec{\beta}_1\vec{\beta}_1^T\ \vec{\beta}_1\vec{\beta}_2^T\ \dots\ \vec{\beta}_1\vec{\beta}_m^T\\ \vec{\beta}_2\vec{\beta}_1^T \ \vec{\beta}_2\vec{\beta}_2^T\ \dots \ \vec{\beta}_2\vec{\beta}_m^T\\\vdots\\ \vec{\beta}_m\vec{\beta}_1^T \ \vec{\beta}_m\vec{\beta}_2^T\ \dots \ \vec{\beta}_m\vec{\beta}_m^T\end{bmatrix}=E
AAT=⎣
⎡β1β2⋮βm⎦
⎤[β1T,β2T,…,βmT]=⎣
⎡β1β1T β1β2T … β1βmTβ2β1T β2β2T … β2βmT⋮βmβ1T βmβ2T … βmβmT⎦
⎤=E
\qquad \ \quad
即
(
β
⃗
i
,
β
⃗
j
)
=
{
0
(
i
≠
j
)
1
(
i
=
j
)
(\vec{\beta}_i,\vec{\beta}_j)=\begin{cases}0\qquad(i\ne j)\\1\qquad(i= j)\end{cases}
(βi,βj)={0(i=j)1(i=j)
\qquad \ \quad
故正交矩阵的行向量构成正交向量组。
Remark: 正交矩阵的转置、逆与乘积仍是正交矩阵
\quad \ \ \quad
证明:设 P 1 , P 2 P_1,P_2 P1,P2为正交矩阵,则 P i T P i = P i P i T = I ( i = 1 , 2 ) P^T_iP_i=P_iP_i^T=I(i=1,2) PiTPi=PiPiT=I(i=1,2)
\quad \ \ \quad
\quad \ \ \quad (1) ( P 1 T ) T P 1 T = P 1 P 1 T = I (P^T_1)^TP_1^T=P_1P_1^T=I (P1T)TP1T=P1P1T=I
\quad \ \ \quad
\quad \ \ \quad (2) ( P 1 − 1 ) T P 1 − 1 = ( P 1 T ) − 1 P 1 − 1 = ( P 1 P 1 T ) − 1 = I (P^{-1}_1)^TP_1^{-1}=(P_1^T)^{-1}P_1^{-1}=(P_1P_1^T)^{-1}=I (P1−1)TP1−1=(P1T)−1P1−1=(P1P1T)−1=I
\quad \ \ \quad
\quad \ \ \quad (3) ( P 1 P 2 ) T ( P 1 P 2 ) = P 2 T P 1 T P 1 P 2 = I (P_1P_2)^T(P_1P_2)=P_2^TP_1^TP_1P_2=I (P1P2)T(P1P2)=P2TP1TP1P2=I(证毕)