向量空间
向量空间的定义
向量空间就是解析几何中的平面向量和空间向量的进一步抽象。回顾解析几何的知识,平面中两个线性无关的向量可以线性表示整个平面上所有的向量,也就是说,对于任意的平面向量
v
v
v及两个线性无关的向量
e
1
,
e
2
e_1,e_2
e1,e2,都存在实数
x
1
,
x
2
x_1,x_2
x1,x2
v
=
x
1
e
1
+
x
2
e
2
v=x_1e_1+x_2e_2
v=x1e1+x2e2
(
x
1
,
x
2
)
(x_1,x_2)
(x1,x2)称为
v
v
v在
e
1
,
e
2
e_1,e_2
e1,e2下的坐标。有了两个线性无关的平面向量,所有平面都和一个实数对一一对应,同样地,所有空间向量都和一个三维实数对具有一一对应的关系。同时,向量的加法(按平行四边形法则)就是实数对各变元相加,向量的数乘就是实数对各变元乘以该实数。我们将这一规则从二、三维推广到n维,就得到n维向量空间。
定义2.1
K
K
K是一个数域,
(
x
1
,
x
2
,
⋯
,
x
n
)
(x_1,x_2,\cdots,x_n)
(x1,x2,⋯,xn)的各变元都是
K
K
K中的数,全体这样的
n
n
n元数对构成的集合称为
n
n
n维向量空间
n
n
n维向量空间实际上就是
n
n
n维空间的一个"点",只不过在二维和三维,我们有明确的几何直观,二维的点就是平面上的一个点或平面上的一个向量,三维的点就是空间上的一个点或空间的一个向量。在超过四维的情况下,我们就无法想象几何上的
n
n
n维向量到底“长成什么样”,不过形式是
n
n
n维实数对。我们规定:
n
n
n维向量空间上的加法为各变元分别相加,数乘为各变元分别乘以该常数。我们就在
n
n
n维向量空间上,建立了两个运算。并且,按照数域的运算性质,容易验证
n
n
n维向量空间有如下的运算性质:
(1)(加法交换律)
x
1
+
x
2
=
x
2
+
x
1
x_1+x_2=x_2+x_1
x1+x2=x2+x1
(2)(加法结合律)
x
1
+
x
2
+
x
3
=
x
1
+
(
x
2
+
x
3
)
x_1+x_2+x_3=x_1+(x_2+x_3)
x1+x2+x3=x1+(x2+x3)
(3)(零元)
0
+
x
=
x
0+x=x
0+x=x
(4)(存在相反元)
x
+
(
−
x
)
=
0
x+(-x)=0
x+(−x)=0
(5)(数乘交换律)
(
a
b
)
x
=
a
(
b
x
)
(ab)x=a(bx)
(ab)x=a(bx)
(6)(数乘结合律)
(
a
+
b
)
x
=
a
x
+
b
x
(a+b)x=ax+bx
(a+b)x=ax+bx
(7)(数乘结合律)
a
(
x
1
+
x
2
)
=
a
x
1
+
a
x
2
a(x_1+x_2)=ax_1+ax_2
a(x1+x2)=ax1+ax2
(8)(单位元)
1.
x
=
x
1.x=x
1.x=x
这样,向量就好像“数”一样与数域中的数一起参与运算,这就启发我们:能运算的,不仅仅只有数,即是是抽象的集合中的元素,也是可以通过定义某种运算,具有某种运算规律,就可以如同数一样进行运算,这样,我们对代数的认识,就从具体,走向抽象,可以认为:抽象,就是现阶段代数的核心!
当然,我们不是为了抽象而进行抽象,向量空间有其明确的几何背景,那就是解析几何中的二维平面向量空间和三维立体几何向量空间,所以,接下来的任务,我们要将平面解析几何和立体解析几何的若干观念,推广到 n n n维向量空间当中。
向量空间的结构
接下来,我们将解析几何中的若干观念,推广到
n
n
n维向量空间中去。我们知道,平面解析几何中,两个向量平行,就等价于存在实数
k
k
k,
x
1
=
k
x
2
x_1=kx_2
x1=kx2,此时
x
1
−
k
x
2
=
0
x_1-kx_2=0
x1−kx2=0两个向量不平行,那么就不存在实数
k
k
k,使得
x
1
=
k
x
2
x_1=kx_2
x1=kx2,如果假设
k
1
x
1
+
k
2
x
2
=
0
k_1x_1+k_2x_2=0
k1x1+k2x2=0那么,就一定有
k
1
=
k
2
=
0
k_1=k_2=0
k1=k2=0,否则,假设
k
1
≠
0
k_1\neq 0
k1=0,那么
x
1
=
−
k
2
k
1
x
2
x_1=-\frac{k_2}{k_1}x_2
x1=−k1k2x2如果两个向量不平行,那么,平面上任意向量,都可以表为这两个向量的线性组合。
x
=
k
1
x
1
+
k
2
x
2
x=k_1x_1+k_2x_2
x=k1x1+k2x2对于
n
n
n维向量,同样有线性相关,线性无关,线性组合的概念。
定义2.2 x 1 , ⋯ , x m x_1,\cdots,x_m x1,⋯,xm是数域 K K K上的 n n n维向量空间的一个向量组, k 1 , ⋯ , k m ∈ K k_1,\cdots,k_m\in K k1,⋯,km∈K,称向量 k 1 x 1 + k 2 x 2 + ⋯ + k m x m k_1x_1+k_2x_2+\cdots+k_mx_m k1x1+k2x2+⋯+kmxm是 x 1 , ⋯ , x m x_1,\cdots,x_m x1,⋯,xm的一个线性组合。
定义2.3
x
1
,
⋯
,
x
m
x_1,\cdots,x_m
x1,⋯,xm是
K
K
K上的
n
n
n维向量空间的一个向量组,如果存在
K
K
K上的一组不全为
0
0
0的数
k
1
,
⋯
,
k
m
∈
K
k_1,\cdots,k_m\in K
k1,⋯,km∈K,使得线性组合
k
1
x
1
+
k
2
x
2
+
⋯
+
k
m
x
m
=
0
k_1x_1+k_2x_2+\cdots+k_mx_m=0
k1x1+k2x2+⋯+kmxm=0则称
x
1
,
⋯
,
x
m
x_1,\cdots,x_m
x1,⋯,xm线性相关,否则称
x
1
,
⋯
,
x
m
x_1,\cdots,x_m
x1,⋯,xm线性无关
下面我们给出线性相关和线性无关的一个等价定义
定理2.1
x
1
,
⋯
,
x
m
x_1,\cdots,x_m
x1,⋯,xm是
K
K
K上的
n
n
n维向量空间的一个向量组,
x
1
,
⋯
,
x
m
x_1,\cdots,x_m
x1,⋯,xm线性相关的充要条件是存在某个向量能被其他向量线性表示
证:
x 1 , ⋯ , x m x_1,\cdots,x_m x1,⋯,xm线性相关,则存在不全为 0 0 0的 K K K中的数 k 1 , ⋯ , k m k_1,\cdots,k_m k1,⋯,km,满足
k 1 x 1 + k 2 x 2 + ⋯ + k m x m = 0 k_1x_1+k_2x_2+\cdots+k_mx_m=0 k1x1+k2x2+⋯+kmxm=0不失一般性,不妨设 k 1 ≠ 0 k_1\neq 0 k1=0,则 x 1 = − 1 k 1 [ k 2 x 2 + ⋯ + k m x m ] x_1=-\frac{1}{k_1}[k_2x_2+\cdots+k_mx_m] x1=−k11[k2x2+⋯+kmxm]
这就说明了,向量组线性相关,就等价于某个向量是"多余"的,体现在该向量能表示成其他向量的线性组合,去掉该向量和保留该向量,前后的向量组是等价的。那么何谓向量组的等价呢?
定义2.4 x 1 , ⋯ , x s x_1,\cdots,x_s x1,⋯,xs, y 1 , ⋯ , y t y_1,\cdots,y_t y1,⋯,yt是 K K K上的 n n n维向量空间的两个向量组,如果每个 x i x_i xi都能被 y 1 , ⋯ , y t y_1,\cdots,y_t y1,⋯,yt线性表出,则称 x 1 , ⋯ , x s x_1,\cdots,x_s x1,⋯,xs能被 y 1 , ⋯ , y t y_1,\cdots,y_t y1,⋯,yt线性表示;如果两个向量组可以相互线性表示,则称两个向量组等价。
容易验证,向量组之间的等价是一个等价关系,即满足自反性,对称性和传递性。容易证明,如果向量组线性相关,去掉能被其他向量线性表示的向量后,两个向量组是等价的,这就足以说明线性相关的原因是因为存在某些多余的向量,剔除掉多余的向量,前后向量组等价。
那么,我们自然联想到,对于线性相关的向量组,我们逐个找到能被其他向量线性表示的向量,予以剔除,直到向量组线性无关,就得到完全没有多余向量的向量组,并且,新的向量组可以线性表出原来线性相关的向量组,就像新的线性无关的向量组就像原来的向量组的一个“不平行的平面向量”一般,通过线性组合就能得到原来的所有向量,这是“基”这个概念的雏形,只不过,在向量组这里,我们称为“极大线性无关组”。
以上过程得到的“极大线性无关组”可能会受到剔除顺序的影响的,不同的剔除顺序得到的极大线性无关组都不同,但是,同一个线性相关向量组通过以上过程得到的极大线性无关组,在向量的数量上是相等的,这就是空间的维度。下面,我们对这里观点进行严格的论证。
为了论述这个结论,我们先讨论齐次方程有非零解的一种特殊情况。
引理2.1 对数域
K
K
K上的齐次线性方程组
{
a
11
x
1
+
a
12
x
2
+
⋯
+
a
1
n
x
n
=
0
a
21
x
1
+
a
22
x
2
+
⋯
+
a
2
n
x
n
=
0
⋯
a
m
1
x
1
+
a
m
2
x
2
+
⋯
+
a
m
n
x
n
=
0
\begin{cases} a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=0\\ a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n=0\\ \cdots\\ a_{m1}x_1+a_{m2}x_2+\cdots+a_{mn}x_n=0 \end{cases}
⎩⎪⎪⎪⎨⎪⎪⎪⎧a11x1+a12x2+⋯+a1nxn=0a21x1+a22x2+⋯+a2nxn=0⋯am1x1+am2x2+⋯+amnxn=0
如果
n
>
m
n>m
n>m,则齐次方程必有非零解
证:
用数学归纳法对 m m m进行归纳:
m = 1 m=1 m=1时,如果 n ≥ 2 n\ge 2 n≥2,则方程组等价于1个方程
a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = 0 a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=0 a11x1+a12x2+⋯+a1nxn=0
如果 a 11 = 0 a_{11}=0 a11=0,那么 ( 1 , 0 , ⋯ , 0 ) (1,0,\cdots,0) (1,0,⋯,0)即是一组非零解。否则, ( a 12 , − a 11 , 0 , ⋯ , 0 ) (a_{12},-a_{11},0,\cdots,0) (a12,−a11,0,⋯,0)即是一组非零解。
假设 m = k m=k m=k时结论都成立,对 k + 1 k+1 k+1个方程,如果 n > k + 1 n>k+1 n>k+1,不妨设 a 11 , ⋯ , a m 1 a_{11},\cdots,a_{m1} a11,⋯,am1不全为0,否则 ( 1 , 0 , ⋯ , 0 ) (1,0,\cdots,0) (1,0,⋯,0)即是一组非零解。可以通过初等变换,方程等价于
{ x 1 + b 12 x 2 + ⋯ + b 1 n x n = 0 0 x 1 + b 22 x 2 + ⋯ + b 2 n x n = 0 ⋯ 0 x 1 + b ( k + 1 ) 2 x 2 + ⋯ + b ( k + 1 ) n x n = 0 \begin{cases} x_1+b_{12}x_2+\cdots+b_{1n}x_n=0\\ 0x_1+b_{22}x_2+\cdots+b_{2n}x_n=0\\ \cdots\\ 0x_1+b_{(k+1)2}x_2+\cdots+b_{(k+1)n}x_n=0 \end{cases} ⎩⎪⎪⎪⎨⎪⎪⎪⎧x1+b12x2+⋯+b1nxn=00x1+b22x2+⋯+b2nxn=0⋯0x1+b(k+1)2x2+⋯+b(k+1)nxn=0由归纳假设,方程组
{ b 22 x 2 + ⋯ + b 2 n x n = 0 ⋯ b ( k + 1 ) 2 x 2 + ⋯ + b ( k + 1 ) n x n = 0 \begin{cases} b_{22}x_2+\cdots+b_{2n}x_n=0\\ \cdots\\ b_{(k+1)2}x_2+\cdots+b_{(k+1)n}x_n=0 \end{cases} ⎩⎪⎨⎪⎧b22x2+⋯+b2nxn=0⋯b(k+1)2x2+⋯+b(k+1)nxn=0存在一组非零解 ( x 2 0 , ⋯ , x n 0 ) (x_2^0,\cdots,x_n^0) (x20,⋯,xn0),再令 x 1 0 = − b 12 x 2 0 + ⋯ − b 1 n x n 0 x_1^0=-b_{12}x_2^0+\cdots-b_{1n}x_n^0 x10=−b12x20+⋯−b1nxn0 ,这样, ( x 1 0 , x 2 0 , ⋯ , x n 0 ) (x_1^0,x_2^0,\cdots,x_n^0) (x10,x20,⋯,xn0)就是方程组的一组非零解。
定理2.2 x 1 , ⋯ , x s x_1,\cdots,x_s x1,⋯,xs和 y 1 , ⋯ , y t y_1,\cdots,y_t y1,⋯,yt是数域 K K K上 n n n维向量空间的两个向量组, x 1 , ⋯ , x s x_1,\cdots,x_s x1,⋯,xs能被 y 1 , ⋯ , y t y_1,\cdots,y_t y1,⋯,yt线性表出, y 1 , ⋯ , y t y_1,\cdots,y_t y1,⋯,yt线性无关, s > t s > t s>t,则 x 1 , ⋯ , x s x_1,\cdots,x_s x1,⋯,xs线性相关
证:
由 x 1 , ⋯ , x s x_1,\cdots,x_s x1,⋯,xs能被 y 1 , ⋯ , y t y_1,\cdots,y_t y1,⋯,yt线性表出,则存在 m n mn mn个 K K K中的数 k i j k_{ij} kij,使得
{ x 1 = k 11 y 1 + ⋯ + k 1 t y t x 2 = k 21 y 1 + ⋯ + k 2 t y t ⋯ x s = k s 1 y 1 + ⋯ + k s t y t \begin{cases} x_1=k_{11}y_1+\cdots+k_{1t}y_t\\ x_2=k_{21}y_1+\cdots+k_{2t}y_t\\ \cdots\\ x_s=k_{s1}y_1+\cdots+k_{st}y_t \end{cases} ⎩⎪⎪⎪⎨⎪⎪⎪⎧x1=k11y1+⋯+k1tytx2=k21y1+⋯+k2tyt⋯xs=ks1y1+⋯+kstyt令 z 1 , ⋯ , z s ∈ S z_1,\cdots,z_s\in S z1,⋯,zs∈S,并且
z 1 x 1 + z 2 x 2 + ⋯ + z s x s = 0 z_1x_1+z_2x_2+\cdots+z_sx_s=0 z1x1+z2x2+⋯+zsxs=0由 y 1 , ⋯ , y t y_1,\cdots,y_t y1,⋯,yt线性无关,就得到线性方程组
{ k 11 z 1 + k 21 z 2 + ⋯ + k s 1 z s = 0 k 12 z 1 + k 22 z 2 + ⋯ + k s 2 z s = 0 ⋯ k 1 t z 1 + k 2 t z 2 + ⋯ + k s t z s = 0 \begin{cases} k_{11}z_1+k_{21}z_2+\cdots+k_{s1}z_s=0\\ k_{12}z_1+k_{22}z_2+\cdots+k_{s2}z_s=0\\ \cdots\\ k_{1t}z_1+k_{2t}z_2+\cdots+k_{st}z_s=0 \end{cases} ⎩⎪⎪⎪⎨⎪⎪⎪⎧k11z1+k21z2+⋯+ks1zs=0k12z1+k22z2+⋯+ks2zs=0⋯k1tz1+k2tz2+⋯+kstzs=0由于 s > t s>t s>t,方程的未知量个数大于方程的个数,那么,方程必有非零解,这就说明了 x 1 , ⋯ , x s x_1,\cdots,x_s x1,⋯,xs线性相关
推论2.1 x 1 , ⋯ , x s x_1,\cdots,x_s x1,⋯,xs和 y 1 , ⋯ , y t y_1,\cdots,y_t y1,⋯,yt是数域 K K K上 n n n维向量空间的两个线性无关的向量组,并且等价,那么 s = t s=t s=t
定义2.5
x
1
,
⋯
,
x
m
x_1,\cdots,x_m
x1,⋯,xm是数域
K
K
K上
n
n
n维向量空间的一个的向量组,
y
1
,
⋯
,
y
s
y_1,\cdots,y_s
y1,⋯,ys是
x
1
,
⋯
,
x
m
x_1,\cdots,x_m
x1,⋯,xm的一个子向量组,如果满足:
(1)
y
1
,
⋯
,
y
s
y_1,\cdots,y_s
y1,⋯,ys线性无关
(2)
x
1
,
⋯
,
x
m
x_1,\cdots,x_m
x1,⋯,xm可由
y
1
,
⋯
,
y
s
y_1,\cdots,y_s
y1,⋯,ys线性表出
则称
y
1
,
⋯
,
y
s
y_1,\cdots,y_s
y1,⋯,ys是
x
1
,
⋯
,
x
m
x_1,\cdots,x_m
x1,⋯,xm的极大线性无关组
任何向量组的极大线性无关组一定存在,但不唯一,但按照推论\ref{cor1},极大线性无关组的向量个数一定是确定的,称极大线性无关组的向量个数是向量组的秩。
向量组的秩,就如图向量组的维数,规定向量组最少可以由其中多少个向量线性表出。
最后,我们来给出向量组和线性方程组之间的联系。对线性方程组
{
a
11
x
1
+
a
12
x
2
+
⋯
+
a
1
n
x
n
=
0
a
21
x
1
+
a
22
x
2
+
⋯
+
a
2
n
x
n
=
0
⋯
a
m
1
x
1
+
a
m
2
x
2
+
⋯
+
a
m
n
x
n
=
0
\begin{cases} a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=0\\ a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n=0\\ \cdots\\ a_{m1}x_1+a_{m2}x_2+\cdots+a_{mn}x_n=0 \end{cases}
⎩⎪⎪⎪⎨⎪⎪⎪⎧a11x1+a12x2+⋯+a1nxn=0a21x1+a22x2+⋯+a2nxn=0⋯am1x1+am2x2+⋯+amnxn=0
实际上,我们可以表成
x
1
a
1
+
x
2
a
2
+
⋯
+
a
n
x
n
=
0
x_1a_1+x_2a_2+\cdots+a_nx_n=0
x1a1+x2a2+⋯+anxn=0其中
a
i
=
(
a
1
i
,
⋯
,
a
m
i
)
a_i=(a_{1i},\cdots,a_{mi})
ai=(a1i,⋯,ami),这样,线性相关就相当以上齐次线性方程组由非零解,线性无关就相当于以上其次线性方程只有零解。
向量组的秩和矩阵的秩
接下来,我们搭起向量组和矩阵之间的桥梁。向量组我们可以写成矩阵的形式,将向量组元素按列排列就是列向量,按行排列就是行向量,那么,任何矩阵都可以视为一个行向量组和列向量组。下面,我们来给出行向量组和列向量组的联系。行向量组的秩称为矩阵的行秩,列向量组的秩为矩阵的列秩
定理2.3 初等行变换不改变矩阵的行秩
证:
设矩阵 A A A的行向量组为 x 1 , x 2 , ⋯ , x n x_1,x_2,\cdots,x_n x1,x2,⋯,xn
交换第 i i i和 j j j行不改变行向量组的构成,交换第 i i i行和第 j j j行后行向量组等价。
将第 i i i行乘以一个非零常数 k k k,则行向量组变为
x 1 ′ = x 1 , ⋯ , x i − 1 ′ = x i − 1 , x i ′ = k x i , x i + 1 ′ = x i + 1 , ⋯ , x n ′ = x n x_1^\prime=x_1,\cdots,x_{i-1}^\prime=x_{i-1}, x_i^\prime=kx_i,x_{i+1}^\prime=x_{i+1},\cdots,x_n^\prime=x_n x1′=x1,⋯,xi−1′=xi−1,xi′=kxi,xi+1′=xi+1,⋯,xn′=xn { x 1 = x 1 ′ ⋯ x i − 1 = x i − 1 ′ x i = 1 k x i ′ x i + 1 = x i + 1 ′ ⋯ x n = x n ′ \begin{cases} x_1 = x_1^\prime \\ \cdots\\ x_{i-1} =x_{i-1}^\prime \\ x_i = \frac{1}{k}x_i^\prime\\ x_{i+1} = x_{i+1}^\prime\\ \cdots\\ x_n= x_n^\prime \end{cases} ⎩⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎧x1=x1′⋯xi−1=xi−1′xi=k1xi′xi+1=xi+1′⋯xn=xn′
因此,前后的行向量组等价。
类似地,可以验证将 i i i行加上第 j j j行的 k k k倍后,前后的行向量组等价。
因此,初等行变换后矩阵的行向量组都等价,初等行变换不改变矩阵的行秩
当然,初等行变换也不改变矩阵的列秩。
定理2.4 初等行变换不改变矩阵的列秩
证:
设 y 1 , ⋯ , y m y_1,\cdots,y_m y1,⋯,ym是矩阵的列向量组,其极大线性无关组为 z 1 , ⋯ , z s z_1,\cdots,z_s z1,⋯,zs。
再设 z i = ( z i 1 , ⋯ , z i n ) z_i=(z_{i1},\cdots,z_{in}) zi=(zi1,⋯,zin),那么方程组
{ z 11 x 1 + z 21 x 2 + ⋯ + z s 1 x s = 0 z 12 x 1 + z 22 x 2 + ⋯ + z s 2 x s = 0 ⋯ z 1 n x 1 + z 2 n x 2 + ⋯ + z s n x s = 0 \begin{cases} z_{11}x_1+z_{21}x_2+\cdots+z_{s1}x_s = 0\\ z_{12}x_1+z_{22}x_2+\cdots+z_{s2}x_s=0\\ \cdots\\ z_{1n}x_1+z_{2n}x_2+\cdots+z_{sn}x_s=0 \end{cases} ⎩⎪⎪⎪⎨⎪⎪⎪⎧z11x1+z21x2+⋯+zs1xs=0z12x1+z22x2+⋯+zs2xs=0⋯z1nx1+z2nx2+⋯+zsnxs=0只有零解,交换两行相当于交换 z i z_i zi的两个变元,相当于交换方程组的两个方程,某行乘以 k k k倍相当于 z i z_i zi对应变元乘以 k k k倍,相当于线性方程组对应行乘以 k k k倍,将第 j j j行的 k k k倍加到第 i i i行相当于将第 j j j个分量的 k k k加到第 i i i个分量,相当于将第 j j j个方程的 k k k倍加到第 i i i个方程。
因而初等行变换后不改变极大线性无关组的线性无关性。只要证明变换后得到的 z 1 ′ , ⋯ , z s ′ z_1^\prime,\cdots,z_s^\prime z1′,⋯,zs′是 y 1 ′ , ⋯ , y n ′ y_1^\prime,\cdots,y_n^\prime y1′,⋯,yn′的极大线性无关组即可。实际上,由于 z 1 , ⋯ , z s z_1,\cdots,z_s z1,⋯,zs是 y 1 , ⋯ , y n y_1,\cdots,y_n y1,⋯,yn的极大线性无关组,对任意的 i = 1 , ⋯ , n i=1,\cdots,n i=1,⋯,n,存在 K K K中的常数 x 1 , ⋯ , x s x_1,\cdots,x_s x1,⋯,xs,使得:
y i = x 1 z 1 + ⋯ + x s z s y_i=x_1z_1+\cdots+x_sz_s yi=x1z1+⋯+xszs设 y i = ( y i 1 , ⋯ , y i n ) y_i=(y_{i1},\cdots,y_{in}) yi=(yi1,⋯,yin),写成线性方程组形式为
{ y i 1 = z 11 x 1 + z 21 x 2 + ⋯ + z s 1 x s y i 2 = z 12 x 1 + z 22 x 2 + ⋯ + z s 2 x s ⋯ y i n = z 1 n x 1 + z 2 n x 2 + ⋯ + z s n x s \begin{cases} y_{i1}=z_{11}x_1+z_{21}x_2+\cdots+z_{s1}x_s\\ y_{i2}=z_{12}x_1+z_{22}x_2+\cdots+z_{s2}x_s\\ \cdots\\ y_{in}=z_{1n}x_1+z_{2n}x_2+\cdots+z_{sn}x_s \end{cases} ⎩⎪⎪⎪⎨⎪⎪⎪⎧yi1=z11x1+z21x2+⋯+zs1xsyi2=z12x1+z22x2+⋯+zs2xs⋯yin=z1nx1+z2nx2+⋯+zsnxs初等行变换相当于交换两个方程,某个方程乘以 k k k倍,将某个方程的 k k k倍加到另一个方程,初等行变换前后方程组都成立,因此, z 1 ′ , ⋯ , z s ′ z_1^\prime,\cdots,z_s^\prime z1′,⋯,zs′是 y 1 ′ , ⋯ , y n ′ y_1^\prime,\cdots,y_n^\prime y1′,⋯,yn′的极大线性无关组
推论2.2 初等列变换不改变矩阵的行秩和列秩
我们知道,任何矩阵都可以通过初等行变换化为行阶梯状矩阵。即
i
≤
r
i\le r
i≤r,第
i
i
i行第
s
i
s_i
si列为
1
1
1,前面的列为
0
0
0,后
n
−
r
n-r
n−r行全为0,并且
1
≤
s
1
<
⋯
<
s
r
≤
n
1\le s_1<\cdots<s_r\le n
1≤s1<⋯<sr≤n。再通过初等列变换,可以将矩阵化成如下的形式:
[
1
⋯
0
1
0
0
]
\left[ \begin{matrix} 1& & & & & \\ &\cdots& & &0& \\ & & 1 & & & \\ & 0 & & &0& \end{matrix} \right]
⎣⎢⎢⎡1⋯0100⎦⎥⎥⎤以上矩阵称为矩阵的标准型,通过标准型,我们就不难得到
定理2.5 矩阵的行秩和列秩相等
我们就称矩阵的行秩或列秩为矩阵的秩,矩阵 A A A的秩记为 r ( A ) r(A) r(A)。以上过程也提供了求解矩阵的秩的方法,就是利用矩阵的初等变换,化为阶梯阵或者标准型。
线性方程组解的结构
对于线性方程组,我们最感兴趣的问题方程组有无解?如果有,有多少解,也就是解的个数。关于这个问题,我们不妨将所有解视为一个空间,考察解空间的结构。
我们先来考察齐次线性方程组的解的结构。对齐次线性方程组
{
a
11
x
1
+
a
12
x
2
+
⋯
+
a
1
n
x
n
=
0
a
21
x
1
+
a
22
x
2
+
⋯
+
a
2
n
x
n
=
0
⋯
a
m
1
x
1
+
a
m
2
x
2
+
⋯
+
a
m
n
x
n
=
0
\begin{cases} a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=0\\ a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n=0\\ \cdots\\ a_{m1}x_1+a_{m2}x_2+\cdots+a_{mn}x_n=0 \end{cases}
⎩⎪⎪⎪⎨⎪⎪⎪⎧a11x1+a12x2+⋯+a1nxn=0a21x1+a22x2+⋯+a2nxn=0⋯am1x1+am2x2+⋯+amnxn=0我们关心的问题是齐次线性方程组是否有非零解。我们将所有的解记成
n
n
n维向量的形式,全体解的集合记为
V
V
V,容易验证:
(1)
x
1
,
x
2
∈
V
x_1,x_2\in V
x1,x2∈V,则
x
1
+
x
2
∈
V
x_1+x_2\in V
x1+x2∈V
(2)
x
∈
V
,
k
∈
K
x\in V,k\in K
x∈V,k∈K,则
k
x
∈
V
kx\in V
kx∈V
也就是说,
V
V
V对向量的加法和数乘是封闭的。我们把
V
V
V称为齐次线性方程组的解空间。正如平面上所有向量可由两个不共线的向量线性表出,空间上所有向量可由三个不共面的向量线性表出。解空间也有这么一组基,所有解都可以表为这组基的线性组合。
类似地,我们就猜想
V
V
V是
K
K
K上齐次线性方程组
{
a
11
x
1
+
a
12
x
2
+
⋯
+
a
1
n
x
n
=
0
a
21
x
1
+
a
22
x
2
+
⋯
+
a
2
n
x
n
=
0
⋯
a
m
1
x
1
+
a
m
2
x
2
+
⋯
+
a
m
n
x
n
=
0
\begin{cases} a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=0\\ a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n=0\\ \cdots\\ a_{m1}x_1+a_{m2}x_2+\cdots+a_{mn}x_n=0 \end{cases}
⎩⎪⎪⎪⎨⎪⎪⎪⎧a11x1+a12x2+⋯+a1nxn=0a21x1+a22x2+⋯+a2nxn=0⋯am1x1+am2x2+⋯+amnxn=0的解空间,存在有限个线性无关的解向量
τ
1
,
⋯
,
τ
s
\tau_1,\cdots,\tau_s
τ1,⋯,τs,方程组任意解可表为该向量组的唯一的线性组合。
定理2.6 对
K
K
K上齐次线性方程组
{
a
11
x
1
+
a
12
x
2
+
⋯
+
a
1
n
x
n
=
0
a
21
x
1
+
a
22
x
2
+
⋯
+
a
2
n
x
n
=
0
⋯
a
m
1
x
1
+
a
m
2
x
2
+
⋯
+
a
m
n
x
n
=
0
\begin{cases} a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=0\\ a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n=0\\ \cdots\\ a_{m1}x_1+a_{m2}x_2+\cdots+a_{mn}x_n=0 \end{cases}
⎩⎪⎪⎪⎨⎪⎪⎪⎧a11x1+a12x2+⋯+a1nxn=0a21x1+a22x2+⋯+a2nxn=0⋯am1x1+am2x2+⋯+amnxn=0
V
V
V是其解空间,
A
A
A是其系数矩阵,
r
=
r
(
A
)
r=r(A)
r=r(A),则存在
n
−
r
n-r
n−r个线性无关的解向量
τ
1
,
⋯
,
τ
n
−
r
\tau_1,\cdots,\tau_{n-r}
τ1,⋯,τn−r,
V
V
V中任意向量可表为
τ
1
,
⋯
,
τ
n
−
r
\tau_1,\cdots,\tau_{n-r}
τ1,⋯,τn−r的线性组合
证:
设 a 1 , ⋯ , a n a_1,\cdots,a_n a1,⋯,an是 A A A的列向量组。
如果 r ( A ) = n r(A)=n r(A)=n,方程组等价于
x 1 a 1 + x 2 a 2 + ⋯ + x n a n = 0 x_1a_1+x_2a_2+\cdots+x_na_n=0 x1a1+x2a2+⋯+xnan=0由 a 1 , ⋯ , a n a_1,\cdots,a_n a1,⋯,an线性无关,方程组仅有零解。
如果 r < n r<n r<n,不妨设 a 1 , ⋯ , a r a_1,\cdots,a_r a1,⋯,ar是 a 1 , ⋯ , a n a_1,\cdots,a_n a1,⋯,an的极大线性无关组,那么 a r + 1 , ⋯ , a n a_{r+1},\cdots,a_n ar+1,⋯,an能被 a 1 , ⋯ , a r a_1,\cdots,a_r a1,⋯,ar线性表出,设
{ a r + 1 = k 11 a 1 + ⋯ + k r 1 a r a r + 2 = k 12 a 1 + ⋯ + k r 2 a r ⋯ a n = k 1 ( n − r ) a 1 + ⋯ + k r ( n − r ) a r \begin{cases} a_{r+1}=k_{11}a_1+\cdots+k_{r1}a_r\\ a_{r+2}=k_{12}a_1+\cdots+k_{r2}a_r\\ \cdots\\ a_n = k_{1(n-r)}a_1+\cdots+k_{r(n-r)}a_r \end{cases} ⎩⎪⎪⎪⎨⎪⎪⎪⎧ar+1=k11a1+⋯+kr1arar+2=k12a1+⋯+kr2ar⋯an=k1(n−r)a1+⋯+kr(n−r)ar代入,就有
∑ i = 1 r ( x i + x r + 1 k i 1 + ⋯ + x n k i ( n − r ) ) a i = 0 \sum_{i=1}^r{(x_i+x_{r+1}k_{i1}+\cdots+x_nk_{i(n-r)})a_i} =0 i=1∑r(xi+xr+1ki1+⋯+xnki(n−r))ai=0再由 a 1 , ⋯ , a r a_1,\cdots,a_r a1,⋯,ar线性无关,就可以得到方程组 { x 1 + x r + 1 k 11 + ⋯ + x n k 1 ( n − r ) = 0 x 2 + x r + 1 k 21 + ⋯ + x n k 2 ( n − r ) = 0 ⋯ x r + x r + 1 k r 1 + ⋯ + x n k r ( n − r ) = 0 (1) \tag{1} \begin{cases} x_1+x_{r+1}k_{11}+\cdots+x_nk_{1(n-r)}=0\\ x_2+x_{r+1}k_{21}+\cdots+x_nk_{2(n-r)}=0\\ \cdots\\ x_r+x_{r+1}k_{r1}+\cdots+x_nk_{r(n-r)}=0 \end{cases} ⎩⎪⎪⎪⎨⎪⎪⎪⎧x1+xr+1k11+⋯+xnk1(n−r)=0x2+xr+1k21+⋯+xnk2(n−r)=0⋯xr+xr+1kr1+⋯+xnkr(n−r)=0(1)对 i = 1 , ⋯ , n − r i=1,\cdots,n-r i=1,⋯,n−r,令
τ i = ( − k 1 i , ⋯ , − k r i , 0 , ⋯ , 0 , 1 , 0 , ⋯ , 0 ) \tau_i = (-k_{1i},\cdots,-k_{ri},0,\cdots,0,1,0,\cdots,0) τi=(−k1i,⋯,−kri,0,⋯,0,1,0,⋯,0)即第 r + i r+i r+i个变元取1,前 r r r个变元取 ( − k 1 i , ⋯ , − k r i ) (-k_{1i},\cdots,-k_{ri}) (−k1i,⋯,−kri),其余变元取0。容易验证 τ 1 , ⋯ , τ n − r \tau_1,\cdots,\tau_{n-r} τ1,⋯,τn−r是方程组的解向量,并且线性无关。
任意线性方程组的解必然满足方程组(1)。这样,设 ( x 1 , ⋯ , x r , x r + 1 , ⋯ , x n ) (x_1,\cdots,x_r,x_{r+1},\cdots,x_n) (x1,⋯,xr,xr+1,⋯,xn)是方程组的解,就有
( x 1 x 2 ⋯ x r ) = ∑ i = 1 n − r x r + i ( − k 1 i − k 2 i ⋯ − k r i ) \left( \begin{matrix} x_1\\ x_2\\ \cdots\\ x_r \end{matrix} \right)= \sum_{i=1}^{n-r}x_{r+i} \left( \begin{matrix} -k_{1i}\\ -k_{2i}\\ \cdots\\ -k_{ri} \end{matrix} \right) ⎝⎜⎜⎛x1x2⋯xr⎠⎟⎟⎞=i=1∑n−rxr+i⎝⎜⎜⎛−k1i−k2i⋯−kri⎠⎟⎟⎞于是
( x 1 x 2 ⋯ x r x r + 1 ⋯ x n ) = ∑ i = 1 n − r x r + i τ i \left( \begin{matrix} x_1\\ x_2\\ \cdots\\ x_r\\ x_{r+1}\\ \cdots\\ x_{n} \end{matrix} \right) = \sum_{i=1}^{n-r}x_{r+i} \tau_i ⎝⎜⎜⎜⎜⎜⎜⎜⎜⎛x1x2⋯xrxr+1⋯xn⎠⎟⎟⎟⎟⎟⎟⎟⎟⎞=i=1∑n−rxr+iτi即任意解向量都可以表为 τ 1 , ⋯ , τ r \tau_1,\cdots,\tau_r τ1,⋯,τr的线性组合
这就证明了基础解系的存在性,并且由基础解系的构造,任意齐次线性方程组任意两个基础解系的向量个数是一致的。并且,由上面的证明过程,我们知道 x r + 1 , ⋯ , x n x_{r+1},\cdots,x_n xr+1,⋯,xn是可以任取的,取定一组值, x 1 , ⋯ , x r x_1,\cdots,x_r x1,⋯,xr随之确定,就得到齐次方程组的一组解,这 n − r n-r n−r个元就称为自由变元。总结上面的论述,就有:
定理2.7 齐次线性方程组的系数矩阵为 A A A, n n n为未知数个数, r = r ( A ) r=r(A) r=r(A),则方程组有非零解的充要条件是 r < n r<n r<n,并且解空间的维数是 n − r n-r n−r
至此,我们完美地解决了齐次线性方程组的求解问题。现在,我们转入到非齐次方程组的求解问题。对非齐次线性方程组
{
a
11
x
1
+
⋯
+
a
1
n
x
n
=
b
1
a
21
x
1
+
⋯
+
a
2
n
x
n
=
b
2
⋯
a
m
1
x
1
+
⋯
+
a
m
n
x
n
=
b
m
\begin{cases} a_{11}x_1+\cdots+a_{1n}x_n=b_1\\ a_{21}x_1+\cdots+a_{2n}x_n=b_2\\ \cdots\\ a_{m1}x_1+\cdots+a_{mn}x_n=b_m \end{cases}
⎩⎪⎪⎪⎨⎪⎪⎪⎧a11x1+⋯+a1nxn=b1a21x1+⋯+a2nxn=b2⋯am1x1+⋯+amnxn=bm我们记系数矩阵为
A
A
A,增广矩阵为
A
‾
\overline{A}
A。系数矩阵的列向量组为
a
1
,
⋯
,
a
n
a_1,\cdots,a_n
a1,⋯,an,常数项向量为
β
\beta
β,方程组就等价于
a
1
x
1
+
⋯
+
a
n
x
n
=
β
a_1x_1+\cdots+a_nx_n=\beta
a1x1+⋯+anxn=β也就是
β
\beta
β能否被
a
1
,
⋯
,
a
n
a_1,\cdots,a_n
a1,⋯,an线性表出。
引理2.3
x
1
,
⋯
,
x
m
∈
K
n
x_1,\cdots,x_m\in K^n
x1,⋯,xm∈Kn是
K
n
K^n
Kn上线性无关的向量组,
β
i
n
K
n
\beta in K^n
βinKn,如果
x
1
,
⋯
,
x
m
,
β
x_1,\cdots,x_m,\beta
x1,⋯,xm,β线性相关,则存在唯一的一组
k
1
,
⋯
,
k
m
∈
K
k_1,\cdots,k_m\in K
k1,⋯,km∈K,使得
β
=
k
1
x
1
+
⋯
+
k
m
x
m
\beta = k_1x_1+\cdots+k_mx_m
β=k1x1+⋯+kmxm
证:
由于 x 1 , ⋯ , x m , β x_1,\cdots,x_m,\beta x1,⋯,xm,β,存在不全为0的一组数 k 1 , ⋯ , k m , k m + 1 k_1,\cdots,k_m,k_{m+1} k1,⋯,km,km+1,使得
k 1 x 1 + ⋯ + k m x m + k m + 1 β = 0 k_1x_1+\cdots+k_mx_m+k_{m+1}\beta=0 k1x1+⋯+kmxm+km+1β=0如果 k m + 1 ≠ 0 k_{m+1}\neq 0 km+1=0,那么 k 1 , ⋯ , k m k_1,\cdots,k_m k1,⋯,km不全为0,并且
k 1 x 1 + ⋯ + k m x m = 0 k_1x_1+\cdots+k_mx_m=0 k1x1+⋯+kmxm=0与 x 1 , ⋯ , x m x_1,\cdots,x_m x1,⋯,xm线性无关矛盾,因此 k m + 1 ≠ 0 k_{m+1}\neq 0 km+1=0,即
β = − 1 k m + 1 k 1 x 1 + ⋯ + k m x m \beta = -\frac{1}{k_{m+1}}{k_1x_1+\cdots+k_mx_m} β=−km+11k1x1+⋯+kmxm这就证明了存在性,再证唯一性,假设
β = k 1 x 1 + ⋯ + k m x m \beta = k_{1}x_1+\cdots+k_mx_m β=k1x1+⋯+kmxm
β = l 1 x 1 + ⋯ + l m x m \beta = l_1x_1+\cdots+l_mx_m β=l1x1+⋯+lmxm那么
( k 1 − l 1 ) x 1 + ⋯ + ( k m − l m ) x m = 0 (k_1-l_1)x_1+\cdots+(k_m-l_m)x_m=0 (k1−l1)x1+⋯+(km−lm)xm=0由 x 1 , ⋯ , x m x_1,\cdots,x_m x1,⋯,xm线性无关,就有
k i = l i i = 1 , ⋯ , m k_i=l_i\quad i=1,\cdots,m ki=lii=1,⋯,m
定理2.8 非齐次线性方程组的系数矩阵为 A A A,增广矩阵为 A ‾ \overline{A} A,则方程组有解的充要条件是 r ( A ) = r ( A ‾ ) r(A)=r(\overline{A}) r(A)=r(A)
证:
设 A A A的列向量组为 a 1 , ⋯ , a n a_1,\cdots,a_n a1,⋯,an,常数项向量为 β \beta β
必要性,假设方程组有解,那么 β \beta β能被 a 1 , ⋯ , a n a_1,\cdots,a_n a1,⋯,an线性表出,因此, a 1 , ⋯ , a n , β a_1,\cdots,a_n,\beta a1,⋯,an,β\和 a 1 , ⋯ , a n a_1,\cdots,a_n a1,⋯,an等价,从而秩相等,因此 r ( A ) = r ( A ‾ ) r(A)=r(\overline{A}) r(A)=r(A)
充分性,假设 r ( A ) = r ( A ‾ ) r(A)=r(\overline{A}) r(A)=r(A),反证法,假设 β \beta β不能被 a 1 , ⋯ , a n a_1,\cdots,a_n a1,⋯,an线性表出,设 a 1 ′ , ⋯ , a s ′ a_1^\prime,\cdots,a_s^\prime a1′,⋯,as′是 a 1 , ⋯ , a n a_1,\cdots,a_n a1,⋯,an的极大线性无关组,那么 a 1 ′ , ⋯ , a s ′ , β a_1^\prime,\cdots,a_s^\prime,\beta a1′,⋯,as′,β一定线性无关,否则 β \beta β能被 a 1 ′ , ⋯ , a s ′ a_1^\prime,\cdots,a_s^\prime a1′,⋯,as′线性表出,与假设矛盾,这样
r ( A ‾ ) ≥ r ( A ) + 1 > r ( A ) r(\overline{A})\ge r(A)+1>r(A) r(A)≥r(A)+1>r(A)又与 r ( A ) = r ( A ‾ ) r(A)=r(\overline{A}) r(A)=r(A)矛盾,矛盾的根源在假设了 β \beta β不能被 a 1 , ⋯ , a n a_1,\cdots,a_n a1,⋯,an线性表出,故 β \beta β能被 a 1 , ⋯ , a n a_1,\cdots,a_n a1,⋯,an线性表出,齐次线性方程组有解
假设非齐次方程组有解,那么解空间又是何种结构呢?设非齐次线性方程组的解空间是
V
V
V,如果
x
1
∈
V
x_1\in V
x1∈V,对任意的
x
∈
V
x\in V
x∈V,
x
−
x
1
x-x_1
x−x1就是齐次方程的解。也就是说,假设
τ
1
,
⋯
,
τ
n
−
r
\tau_1,\cdots,\tau_{n-r}
τ1,⋯,τn−r是齐次方程的基础解系,那么存在
c
1
,
⋯
,
c
n
−
r
c_1,\cdots,c_{n-r}
c1,⋯,cn−r,使得
x
=
x
1
+
c
1
τ
1
+
⋯
+
c
n
−
r
τ
n
−
r
x=x_1+c_1\tau_1+\cdots+c_{n-r}\tau_{n-r}
x=x1+c1τ1+⋯+cn−rτn−r反过来,对任意的常数
c
1
,
⋯
,
c
n
−
r
c_1,\cdots,c_{n-r}
c1,⋯,cn−r,向量
x
1
+
c
1
τ
1
+
⋯
+
c
n
−
r
τ
n
−
r
x_1+c_1\tau_1+\cdots+c_{n-r}\tau_{n-r}
x1+c1τ1+⋯+cn−rτn−r必定是非齐次方程的解,也就是说,任何非齐次方程的解等于某个特解+齐次方程的通解。至此,我们已经明晰了非齐次方程和齐次方程解的结构,我们对上面的论述,总结到如下定理:
定理2.9 非齐次线性方程的系数矩阵为
A
A
A,增广矩阵为
A
‾
\overline{A}
A,未知数个数为
n
n
n,则
(1)
r
(
A
)
≠
r
(
A
‾
)
r(A)\neq r(\overline{A})
r(A)=r(A)时方程组无解
(2)
r
(
A
)
=
r
(
A
‾
)
=
n
r(A)=r(\overline{A})=n
r(A)=r(A)=n时,方程组有唯一解
(3)
r
(
A
)
=
r
(
A
‾
)
<
n
r(A)=r(\overline{A})<n
r(A)=r(A)<n时,方程组有无穷多组解
至此,我们彻底回答了如何求解线性方程组,线性方程组有无解,有多少解的问题。而我们回答这些问题的过程,是借助向量空间而非直接对数的运算进行讨论的,我们也可以看到,方程组有界还是无解的问题,齐次方程有无非零解的问题,本质上是向量空间的向量组线性相关还是线性无关,向量组的秩,以及某个向量能否被系数矩阵向量组线性表示的问题。可见,要解决一个代数方程的问题,我们不一定要直接对数的运算进行讨论。更多的是认清代数方程背后的抽象代数系统的代数结构,这就是代数学的核心与精髓。
矩阵论初步
矩阵的加法和数乘
上一章,我们将矩阵视为向量的组合,这一章,我们把矩阵视为单独的元素,赋予矩阵一些运算,使矩阵也成为一个代数系统。我们将会看到,能"算"的,不仅仅只有数和向量,甚至矩阵也能"算"。
我们记全体
K
K
K上的
m
m
m行
n
n
n列矩阵为
M
m
,
n
M_{m,n}
Mm,n,定义
M
m
,
n
M_{m,n}
Mm,n上的加法是对应位置的数相加,即
[
a
11
a
12
⋯
a
1
n
⋯
⋯
⋯
⋯
a
m
1
a
m
2
⋯
a
m
n
]
+
[
b
11
b
12
⋯
b
1
n
⋯
⋯
⋯
⋯
b
m
1
b
m
2
⋯
b
m
n
]
=
[
a
11
+
b
11
a
12
+
b
12
⋯
a
1
n
+
b
1
n
⋯
⋯
⋯
⋯
a
m
1
+
b
m
1
a
m
2
+
b
m
2
⋯
a
m
n
+
b
m
n
]
\left[ \begin{matrix} a_{11}&a_{12}&\cdots&a_{1n}\\ \cdots&\cdots&\cdots&\cdots\\ a_{m1}&a_{m2}&\cdots&a_{mn} \end{matrix} \right] + \left[ \begin{matrix} b_{11}&b_{12}&\cdots&b_{1n}\\ \cdots&\cdots&\cdots&\cdots\\ b_{m1}&b_{m2}&\cdots&b_{mn} \end{matrix} \right] =\\ \left[ \begin{matrix} a_{11}+b_{11}&a_{12}+b_{12}&\cdots&a_{1n}+b_{1n}\\ \cdots&\cdots&\cdots&\cdots\\ a_{m1}+b_{m1}&a_{m2}+b_{m2}&\cdots&a_{mn}+b_{mn} \end{matrix} \right]
⎣⎡a11⋯am1a12⋯am2⋯⋯⋯a1n⋯amn⎦⎤+⎣⎡b11⋯bm1b12⋯bm2⋯⋯⋯b1n⋯bmn⎦⎤=⎣⎡a11+b11⋯am1+bm1a12+b12⋯am2+bm2⋯⋯⋯a1n+b1n⋯amn+bmn⎦⎤矩阵的数乘定义为
k
[
a
11
a
12
⋯
a
1
n
⋯
⋯
⋯
⋯
a
m
1
a
m
2
⋯
a
m
n
]
=
[
k
a
11
k
a
12
⋯
k
a
1
n
⋯
⋯
⋯
⋯
k
a
m
1
k
a
m
2
⋯
k
a
m
n
]
k\left[ \begin{matrix} a_{11}&a_{12}&\cdots&a_{1n}\\ \cdots&\cdots&\cdots&\cdots\\ a_{m1}&a_{m2}&\cdots&a_{mn} \end{matrix} \right] =\left[ \begin{matrix} ka_{11}&ka_{12}&\cdots&ka_{1n}\\ \cdots&\cdots&\cdots&\cdots\\ ka_{m1}&ka_{m2}&\cdots&ka_{mn} \end{matrix} \right]
k⎣⎡a11⋯am1a12⋯am2⋯⋯⋯a1n⋯amn⎦⎤=⎣⎡ka11⋯kam1ka12⋯kam2⋯⋯⋯ka1n⋯kamn⎦⎤由数域的运算规律,容易验证,矩阵空间
M
m
,
n
M_{m,n}
Mm,n也有如下的八条运算规律:
(1)
A
∈
M
m
,
n
,
B
∈
M
m
,
n
A\in M_{m,n},B\in M_{m,n}
A∈Mm,n,B∈Mm,n,
A
+
B
=
B
+
A
A+B=B+A
A+B=B+A
(2)
A
,
B
,
C
∈
M
m
,
n
,
A
+
B
+
C
=
A
+
(
B
+
C
)
A,B,C\in M_{m,n},A+B+C=A+(B+C)
A,B,C∈Mm,n,A+B+C=A+(B+C)
(3)
0
+
A
=
A
∀
A
∈
M
m
,
n
0+A=A\quad \forall A \in M_{m,n}
0+A=A∀A∈Mm,n
(4)
−
A
+
A
=
0
∀
A
∈
M
m
,
n
-A+A=0\quad \forall A\in M_{m,n}
−A+A=0∀A∈Mm,n
(5)
1.
A
=
A
∀
A
∈
M
m
,
n
1.A=A\quad \forall A\in M_{m,n}
1.A=A∀A∈Mm,n
(6)
k
l
.
A
=
k
(
l
A
)
∀
A
∈
M
m
,
n
,
k
,
l
∈
K
kl.A=k(lA) \quad \forall A \in M_{m,n},k,l\in K
kl.A=k(lA)∀A∈Mm,n,k,l∈K
(7)
k
(
A
+
B
)
=
k
A
+
k
B
∀
k
∈
K
,
A
,
B
∈
M
m
,
n
k(A+B)=kA+kB\quad \forall k \in K,A,B\in M_{m,n}
k(A+B)=kA+kB∀k∈K,A,B∈Mm,n
(8)
(
k
+
l
)
A
=
k
A
+
l
A
∀
k
,
l
∈
K
,
A
∈
M
m
,
n
(k+l)A=kA+lA\quad \forall k,l\in K,A\in M_{m,n}
(k+l)A=kA+lA∀k,l∈K,A∈Mm,n
矩阵在这个层面上运算性质和向量相类似。
矩阵的乘法
接下来我们引入矩阵的乘法。我们先引入线性变换的概念,只不过在这里我们是狭义的线性变换,对
n
n
n维向量
(
x
1
,
⋯
,
x
n
)
(x_1,\cdots,x_n)
(x1,⋯,xn),我们可以通过变换
{
y
1
=
a
11
x
1
+
⋯
+
a
1
n
x
n
⋯
y
m
=
a
m
1
x
1
+
⋯
+
a
m
n
x
n
\begin{cases} y_1 = a_{11}x_1+\cdots+a_{1n}x_n\\ \cdots\\ y_m = a_{m1}x_1+\cdots+a_{mn}x_n \end{cases}
⎩⎪⎨⎪⎧y1=a11x1+⋯+a1nxn⋯ym=am1x1+⋯+amnxn将其变换为
m
m
m维向量,我们姑且称为线性变换。矩阵
A
=
[
a
11
⋯
a
1
n
⋯
⋯
⋯
a
m
1
⋯
a
m
n
]
A=\left[ \begin{matrix} a_{11}&\cdots&a_{1n}\\ \cdots&\cdots&\cdots\\ a_{m1}&\cdots&a_{mn} \end{matrix} \right]
A=⎣⎡a11⋯am1⋯⋯⋯a1n⋯amn⎦⎤就称为线性变换的矩阵,我们再将
(
y
1
,
⋯
,
y
m
)
(y_1,\cdots,y_m)
(y1,⋯,ym)通过线性变换,变换为
(
z
1
,
⋯
,
z
k
)
(z_1,\cdots,z_k)
(z1,⋯,zk),线性变换矩阵为
B
=
[
b
11
⋯
b
1
m
⋯
⋯
⋯
b
k
1
⋯
b
k
m
]
B=\left[ \begin{matrix} b_{11}&\cdots&b_{1m}\\ \cdots&\cdots&\cdots\\ b_{k1}&\cdots&b_{km} \end{matrix} \right]
B=⎣⎡b11⋯bk1⋯⋯⋯b1m⋯bkm⎦⎤两个线性变换的复合,也是线性变换,我们代入验证就可以说明这点:
z
i
=
b
i
1
y
1
+
⋯
+
b
i
m
y
m
=
b
i
1
(
a
11
x
1
+
⋯
+
a
1
n
x
n
)
+
⋯
+
b
i
m
(
a
m
1
x
1
+
⋯
+
a
m
n
x
n
)
=
(
∑
s
=
1
m
b
i
s
a
s
1
)
x
1
+
⋯
+
(
∑
s
=
1
m
b
i
s
a
s
n
)
x
n
z_i = b_{i1}y_1+\cdots+b_{im}y_m\\ =b_{i1}(a_{11}x_1+\cdots+a_{1n}x_n)+ \cdots+ b_{im}(a_{m1}x_1+\cdots+a_{mn}x_n)\\ =(\sum_{s=1}^m{b_{is}a_{s1}})x_1+\cdots+ (\sum_{s=1}^m{b_{is}a_{sn}})x_n
zi=bi1y1+⋯+bimym=bi1(a11x1+⋯+a1nxn)+⋯+bim(am1x1+⋯+amnxn)=(s=1∑mbisas1)x1+⋯+(s=1∑mbisasn)xn其中:
1
≤
i
≤
k
1\le i \le k
1≤i≤k,两个线性变换的复合还是线性变换,矩阵为
[
∑
s
=
1
m
b
1
s
a
s
1
⋯
∑
s
=
1
m
b
1
s
a
s
n
⋯
⋯
⋯
∑
s
=
1
m
b
k
s
a
s
1
⋯
∑
s
=
1
m
b
k
s
a
s
n
]
\left[ \begin{matrix} \sum_{s=1}^m{b_{1s}a_{s1}}&\cdots&\sum_{s=1}^m{b_{1s}a_{sn}}\\ \cdots&\cdots&\cdots\\ \sum_{s=1}^m{b_{ks}a_{s1}}&\cdots&\sum_{s=1}^m{b_{ks}a_{sn}} \end{matrix} \right]
⎣⎡∑s=1mb1sas1⋯∑s=1mbksas1⋯⋯⋯∑s=1mb1sasn⋯∑s=1mbksasn⎦⎤
我们就定义这个矩阵是
A
A
A和
B
B
B的乘积,下面我们给出一个正式的定义:
定义2.6
A
=
(
a
i
j
)
A=(a_{ij})
A=(aij)是
K
K
K上的
n
×
m
n\times m
n×m矩阵,
B
=
(
b
i
j
)
B=(b_{ij})
B=(bij)是
K
K
K上的
m
×
k
m\times k
m×k矩阵,定义
A
A
A和
B
B
B的乘积为
A
B
=
[
∑
s
=
1
m
b
1
s
a
s
1
⋯
∑
s
=
1
m
b
1
s
a
s
n
⋯
⋯
⋯
∑
s
=
1
m
b
k
s
a
s
1
⋯
∑
s
=
1
m
b
k
s
a
s
n
]
AB=\left[ \begin{matrix} \sum_{s=1}^m{b_{1s}a_{s1}}&\cdots&\sum_{s=1}^m{b_{1s}a_{sn}}\\ \cdots&\cdots&\cdots\\ \sum_{s=1}^m{b_{ks}a_{s1}}&\cdots&\sum_{s=1}^m{b_{ks}a_{sn}} \end{matrix} \right]
AB=⎣⎡∑s=1mb1sas1⋯∑s=1mbksas1⋯⋯⋯∑s=1mb1sasn⋯∑s=1mbksasn⎦⎤
与数域乘法不同的是,矩阵的乘法,没有交换律,这是很明显的一个事实,因为
A
B
AB
AB有意义,
B
A
BA
BA不一定有意义,即使两者都有意义,也不一定相等。下面我们来验证矩阵乘法的一些运算规律。
(1)
A
∈
M
n
,
m
,
B
,
C
∈
M
m
,
s
,
A
(
B
+
C
)
=
A
B
+
A
C
A\in M_{n,m},B,C\in M_{m,s},A(B+C)=AB+AC
A∈Mn,m,B,C∈Mm,s,A(B+C)=AB+AC
(2)
A
,
B
∈
M
n
,
m
,
C
∈
M
m
,
s
,
(
A
+
B
)
C
=
A
C
+
B
C
A,B\in M_{n,m},C\in M_{m,s},(A+B)C=AC+BC
A,B∈Mn,m,C∈Mm,s,(A+B)C=AC+BC
(3)
A
∈
M
n
,
m
,
B
∈
M
m
,
s
,
k
∈
K
,
k
A
B
=
(
k
A
)
B
=
A
(
k
B
)
A\in M_{n,m},B\in M_{m,s},k\in K,kAB = (kA)B=A(kB)
A∈Mn,m,B∈Mm,s,k∈K,kAB=(kA)B=A(kB)
(4)
A
∈
M
n
,
t
,
B
∈
M
t
,
k
,
C
∈
M
k
,
m
,
A
B
C
=
A
(
B
C
)
A\in M_{n,t},B\in M_{t,k},C\in M_{k,m} ,ABC=A(BC)
A∈Mn,t,B∈Mt,k,C∈Mk,m,ABC=A(BC)
我们仅验证(1)(4),(2)(3)的验证和(1)类似,这里省略
设
A
=
(
a
i
j
)
A=(a_{ij})
A=(aij),
B
=
(
b
i
j
)
,
C
=
(
c
i
j
)
B=(b_{ij}),C=(c_{ij})
B=(bij),C=(cij),则
B
+
C
=
(
b
i
j
+
c
i
j
)
B+C=(b_{ij}+c_{ij})
B+C=(bij+cij)因此,设
A
(
B
+
C
)
=
(
d
i
j
)
A(B+C)=(d_{ij})
A(B+C)=(dij)则
d
i
j
=
∑
s
=
1
m
a
i
s
(
b
s
j
+
c
s
j
)
=
∑
s
=
1
m
a
i
s
b
s
j
+
∑
s
=
1
m
a
i
s
c
s
j
d_{ij}=\sum_{s=1}^m{a_{is}(b_{sj}+c_{sj})}= \sum_{s=1}^m{a_{is}b_{sj}}+\sum_{s=1}^m{a_{is}c_{sj}}
dij=s=1∑mais(bsj+csj)=s=1∑maisbsj+s=1∑maiscsj
因此,
A
(
B
+
C
)
=
A
B
+
A
C
A(B+C)=AB+AC
A(B+C)=AB+AC
(4)设
A
=
(
a
i
j
)
,
B
=
(
b
i
j
)
,
C
=
(
c
i
j
)
A=(a_{ij}),B=(b_{ij}),C=(c_{ij})
A=(aij),B=(bij),C=(cij)
A
B
=
(
∑
s
1
=
1
t
a
i
s
1
b
s
1
j
)
AB=(\sum_{s_1=1}^t{a_{is_1}b_{s_1j}})
AB=(s1=1∑tais1bs1j)于是
(
A
B
)
C
=
(
∑
s
2
=
1
k
(
∑
s
1
=
1
t
a
i
s
1
b
s
1
s
2
)
c
s
2
j
)
=
(
∑
s
2
=
1
k
∑
s
1
=
1
t
(
a
i
s
1
b
s
1
s
2
c
s
2
j
)
)
=
(
∑
s
1
=
1
t
∑
s
2
=
1
k
(
a
i
s
1
b
s
1
s
2
c
s
2
j
)
)
=
(
∑
s
1
=
1
t
[
a
i
s
1
∑
s
2
=
1
k
b
s
1
s
2
c
s
2
j
]
)
(AB)C = (\sum_{s_2=1}^k(\sum_{s_1=1}^t{a_{is_1}b_{s_1s_2}})c_{s_2j}) =(\sum_{s_2=1}^k\sum_{s_1=1}^t(a_{is_1}b_{s_1s_2}c_{s_2j}))\\ =(\sum_{s_1=1}^t\sum_{s_2=1}^k(a_{is_1}b_{s_1s_2}c_{s_2j})) =(\sum_{s_1=1}^t[a_{is_1}\sum_{s_2=1}^kb_{s_1s_2}c_{s_2j}])
(AB)C=(s2=1∑k(s1=1∑tais1bs1s2)cs2j)=(s2=1∑ks1=1∑t(ais1bs1s2cs2j))=(s1=1∑ts2=1∑k(ais1bs1s2cs2j))=(s1=1∑t[ais1s2=1∑kbs1s2cs2j])而
B
C
=
(
∑
s
2
=
1
k
b
s
1
s
2
c
s
2
j
)
BC = (\sum_{s_2=1}^kb_{s_1s_2}c_{s_2j})
BC=(s2=1∑kbs1s2cs2j)故
(
A
B
)
C
=
A
(
B
C
)
(AB)C=A(BC)
(AB)C=A(BC)这说明了矩阵乘法有结合律。
有了矩阵的乘法,我们就可以用矩阵乘法的形式,表示线性方程组,对于线性方程组
{
a
11
x
1
+
⋯
+
a
1
n
x
n
=
b
1
⋯
a
m
1
x
1
+
⋯
+
a
m
n
x
n
=
b
m
\begin{cases} a_{11}x_1+\cdots+a_{1n}x_n=b_1\\ \cdots\\ a_{m1}x_1+\cdots+a_{mn}x_n=b_m \end{cases}
⎩⎪⎨⎪⎧a11x1+⋯+a1nxn=b1⋯am1x1+⋯+amnxn=bm系数矩阵的为
A
A
A,未知量矩阵是
x
1
,
⋯
,
x
n
x_1,\cdots,x_n
x1,⋯,xn组成的列向量,记为
x
x
x,常数项矩阵是
b
1
,
⋯
,
b
m
b_1,\cdots,b_m
b1,⋯,bm组成的列向量,记为
b
b
b,则方程组就可以用组成表示为
A
x
=
b
Ax=b
Ax=b线性变换又可以表示为
y
=
A
x
y=Ax
y=Ax这也就不难理解为什么线性变换的复合的矩阵是矩阵的乘法了。这是因为,对于另一个线性变换
z
=
B
y
z=By
z=By就有
z
=
B
y
=
B
(
A
x
)
=
(
B
A
)
x
z=By=B(Ax)=(BA)x
z=By=B(Ax)=(BA)x
接下来,我们要给出矩阵乘法和初等变换之间的关系。对角元全为1,其他全为0的
n
n
n阶方阵称为
n
n
n阶单位矩阵,记为
I
n
I_n
In,交换
I
n
I_n
In的
i
,
j
i,j
i,j两列或
i
,
j
i,j
i,j两列得到的矩阵记为
E
n
(
i
,
j
)
E_n(i,j)
En(i,j),设
E
n
(
i
,
j
)
=
(
e
k
t
)
E_n(i,j)=(e_{kt})
En(i,j)=(ekt),则
e
k
t
=
{
1
k
=
t
≠
i
,
j
1
k
=
i
,
t
=
j
1
k
=
j
,
t
=
i
0
o
t
h
e
r
w
i
s
e
e_{kt}=\begin{cases} 1 & k=t\neq i,j\\ 1 & k=i,t=j\\ 1 & k=j,t=i\\ 0 & otherwise \end{cases}
ekt=⎩⎪⎪⎪⎨⎪⎪⎪⎧1110k=t=i,jk=i,t=jk=j,t=iotherwise对
m
×
n
m\times n
m×n矩阵
A
A
A,就有
E
m
(
i
,
j
)
A
=
(
∑
s
=
1
n
e
k
s
a
s
t
)
E_m(i,j)A=(\sum_{s=1}^n{e_{ks}a_{st}})
Em(i,j)A=(s=1∑neksast)注意到
k
≠
i
,
j
k\neq i,j
k=i,j时
∑
s
=
1
n
e
k
s
a
s
t
=
a
k
t
\sum_{s=1}^n{e_{ks}a_{st}}=a_{kt}
s=1∑neksast=akt
∑
s
=
1
n
e
i
s
a
s
t
=
a
j
t
\sum_{s=1}^n{e_{is}a_{st}}=a_{jt}
s=1∑neisast=ajt
∑
s
=
1
n
e
j
s
a
s
t
=
a
i
t
\sum_{s=1}^n{e_{js}a_{st}}=a_{it}
s=1∑nejsast=ait可见:
E
m
(
i
,
j
)
A
E_m(i,j)A
Em(i,j)A相当于交换
A
A
A的
i
,
j
i,j
i,j两行,同理可以验证
A
E
n
(
i
,
j
)
AE_n(i,j)
AEn(i,j)相当于交换
A
A
A的
i
,
j
i,j
i,j两列。
令 E n ( i : k ) E_n(i:k) En(i:k)是 I n I_n In的第 i i i行(或第i列)乘以 k k k倍,其中 k ≠ 0 k\neq 0 k=0, A A A左乘 E m ( i : k ) E_m(i:k) Em(i:k)相当于 A A A的第 i i i行乘以 k k k倍,右乘 E n ( i : k ) E_n(i:k) En(i:k)相当于 A A A的第 i i i列乘以 k k k倍
令 E n ( i , j : k ) E_n(i,j:k) En(i,j:k)为 I n I_n In的第 i i i行的 k k k倍加到第 j j j行,左乘 E m ( i , j : k ) E_m(i,j:k) Em(i,j:k),相当于将 A A A的第 i i i行的 k k k倍加到第 j j j行,右乘 E n ( i , j : k ) E_n(i,j:k) En(i,j:k)相当于把 A A A的第 i i i列加到第 j j j列。
我们称以上三种类型的矩阵为初等矩阵,就有:
(1)初等行变换相当于左乘相应的初等矩阵
(2)初等列变换相当于右乘相应的初等矩阵
这样,我们就把初等变换和矩阵乘法联系起来了。
矩阵的转置
m
×
n
m\times n
m×n矩阵
A
=
(
a
i
j
)
A=(a_{ij})
A=(aij)的转置定义为
n
×
m
n\times m
n×m矩阵
(
a
j
i
)
(a_{ji})
(aji),记为
A
T
A^T
AT。显然,矩阵的转置只是改变矩阵的形状,原来的行向量组变为转置矩阵的列向量组,原来的列向量组变为转置矩阵的行向量组,因而,矩阵的转置不改变矩阵的秩。即
r
(
A
)
=
r
(
A
T
)
r(A)=r(A^T)
r(A)=r(AT)下面,我们来验证转置矩阵的相关性质:
(1)
A
,
B
∈
M
m
,
n
,
(
A
+
B
)
T
=
A
T
+
B
T
A,B\in M_{m,n}, (A+B)^T=A^T+B^T
A,B∈Mm,n,(A+B)T=AT+BT
(2)
A
∈
M
m
,
n
,
(
k
A
)
T
=
k
A
T
A\in M_{m,n},(kA)^T=kA^T
A∈Mm,n,(kA)T=kAT
(3)
A
∈
M
m
,
t
,
B
∈
M
t
,
n
,
(
A
B
)
T
=
B
T
A
T
A\in M_{m,t},B\in M_{t,n}, (AB)^T=B^TA^T
A∈Mm,t,B∈Mt,n,(AB)T=BTAT
(1)(2)是显然的,我们仅验证(3):
设
A
=
(
a
i
j
)
,
B
=
(
b
i
j
)
A=(a_{ij}),B=(b_{ij})
A=(aij),B=(bij),则
A
B
=
(
∑
s
=
1
t
a
i
s
b
s
j
)
AB=(\sum_{s=1}^t{a_{is}b_{sj}})
AB=(s=1∑taisbsj)设
A
T
=
(
a
j
i
)
=
(
c
i
j
)
,
B
T
=
(
b
j
i
)
=
(
d
i
j
)
A^T=(a_{ji})=(c_{ij}),B^T=(b_{ji})=(d_{ij})
AT=(aji)=(cij),BT=(bji)=(dij)因此
(
A
B
)
T
=
(
∑
s
=
1
t
a
j
s
b
s
i
)
=
(
∑
s
=
1
t
c
s
j
d
i
s
)
=
B
T
A
T
(AB)^T=(\sum_{s=1}^t{a_{js}b_{si}})= (\sum_{s=1}^t{c_{sj}d_{is}})=B^TA^T
(AB)T=(s=1∑tajsbsi)=(s=1∑tcsjdis)=BTAT
方阵的逆矩阵
方阵的逆矩阵和"数"的逆元是类似的。在数域上有"1"这个数,我们把全体
n
n
n阶方阵记为
M
n
M_n
Mn,则
I
n
I_n
In在
M
n
M_n
Mn中充当的作用就相当于"1"在数域中充当的作用,即对任意的
A
∈
M
n
A\in M_n
A∈Mn,都有
A
I
n
=
I
n
A
=
A
AI_n=I_nA=A
AIn=InA=A。在数域上有倒数的概念,在
M
n
M_n
Mn中的倒数就是所谓的逆矩阵。
定义2.7
A
∈
M
n
A\in M_n
A∈Mn,如果存在
B
∈
M
n
B\in M_n
B∈Mn,使得
A
B
=
I
n
AB=I_n
AB=In则称
A
A
A为可逆矩阵,或非奇异矩阵,
B
B
B称为
A
A
A的逆矩阵,记为
A
−
1
A^{-1}
A−1,否则称
A
A
A为不可逆矩阵,或奇异矩阵
满足什么条件
n
n
n阶方阵可逆呢?我们假设逆矩阵
A
−
1
A^{-1}
A−1存在,记其列向量组为
b
1
,
⋯
,
b
n
b_1,\cdots,b_n
b1,⋯,bn,记
e
i
e_i
ei为第
i
i
i个变元为1,其他变元为0的列向量,就有以下
n
n
n个方程组:
A
b
i
=
e
i
(
i
=
1
,
⋯
,
n
)
Ab_i=e_i(i=1,\cdots,n)
Abi=ei(i=1,⋯,n)存在矩阵
B
B
B使得
A
B
=
I
n
AB=I_n
AB=In的充要条件是以上
n
n
n个方程组都有解。满足什么条件就会有以上
n
n
n个方程组都有解呢?如果
r
(
A
)
=
n
r(A)=n
r(A)=n,那么以上
n
n
n个方程组增广矩阵的秩一定等于
n
n
n,
n
n
n个方程组都有解,如果
r
=
r
(
A
)
<
n
r=r(A)<n
r=r(A)<n,设
A
A
A的行向量组为
β
1
,
⋯
,
β
n
\beta_1,\cdots,\beta_n
β1,⋯,βn,不妨设
β
1
,
⋯
,
β
r
\beta_1,\cdots,\beta_r
β1,⋯,βr是行向量组的极大线性无关组。则第
n
n
n个方程的增广矩阵可表为
[
β
1
0
β
2
0
⋯
β
n
−
1
0
β
n
1
]
\left[ \begin{matrix} \beta_1&0\\ \beta_2&0\\ \cdots\\ \beta_{n-1}&0\\ \beta_n&1 \end{matrix} \right]
⎣⎢⎢⎢⎢⎡β1β2⋯βn−1βn0001⎦⎥⎥⎥⎥⎤由于
β
1
,
⋯
,
β
r
\beta_1,\cdots,\beta_r
β1,⋯,βr是极大线性无关组,则
β
r
+
1
,
⋯
,
β
n
\beta_{r+1},\cdots,\beta_n
βr+1,⋯,βn可由
β
1
,
⋯
,
β
r
\beta_1,\cdots,\beta_r
β1,⋯,βr线性表出,那么,就可以通过初等行变换,将增广矩阵化为
[
β
1
0
⋯
β
r
0
0
0
⋯
0
0
0
1
]
\left[ \begin{matrix} \beta_1&0\\ \cdots\\ \beta_r&0\\ 0&0\\ \cdots\\ 0&0\\ 0&1 \end{matrix} \right]
⎣⎢⎢⎢⎢⎢⎢⎢⎢⎡β1⋯βr0⋯0000001⎦⎥⎥⎥⎥⎥⎥⎥⎥⎤这说明
r
(
A
‾
)
=
r
(
A
)
r(\overline{A})=r(A)
r(A)=r(A),也就是说存在某个方程组无解,
A
A
A一定不可逆。这样,我们就得到了
A
A
A可逆的一个充要条件
r
(
A
)
=
n
r(A)=n
r(A)=n。同时由上面的论述,逆矩阵的每个列向量都是某个方程的解,并且,每个方程都只有唯一解,因此,逆矩阵也是唯一的
定理2.10 n n n阶方阵 A A A可逆的充要条件是 r ( A ) = n r(A)=n r(A)=n,并且逆矩阵若存在,必唯一
定理2.11 n n n阶方阵 A A A可逆,则 A = ( A − 1 ) − 1 A=(A^{-1})^{-1} A=(A−1)−1
也就是 A A A和 A − 1 A^{-1} A−1互为逆矩阵。为了证明这个定理,我们首先给出一个引理:
引理2.2 初等矩阵的都是可逆矩阵,并且
E
n
−
1
(
i
,
j
)
=
E
n
(
i
,
j
)
E_n^{-1}(i,j)=E_n(i,j)
En−1(i,j)=En(i,j)
E
n
−
1
(
i
:
k
)
=
E
n
(
i
:
1
k
)
(
k
≠
0
)
E_n^{-1}(i:k)=E_n(i:\frac{1}{k})(k\neq 0)
En−1(i:k)=En(i:k1)(k=0)
E
n
−
1
(
i
,
j
:
k
)
=
E
n
(
i
,
j
:
−
k
)
E_n^{-1}(i,j:k)=E_n(i,j:-k)
En−1(i,j:k)=En(i,j:−k)
同时
E
n
−
1
(
i
,
j
)
E
n
(
i
,
j
)
=
I
n
E_n^{-1}(i,j)E_n(i,j)=I_n
En−1(i,j)En(i,j)=In
E
n
(
i
:
1
k
)
E
n
−
1
(
i
:
k
)
=
I
n
E_n(i:\frac{1}{k})E_n^{-1}(i:k)=I_n
En(i:k1)En−1(i:k)=In
E
n
(
i
,
j
:
−
k
)
E
n
−
1
(
i
,
j
:
k
)
=
I
n
E_n(i,j:-k)E_n^{-1}(i,j:k)=I_n
En(i,j:−k)En−1(i,j:k)=In
这个引理直接验证即可
引理2.3 可逆矩阵可经过有限步初等列变换化为单位矩阵
证:
用数学归纳法证明:
对一阶方阵 A = ( a 11 ) A=(a_{11}) A=(a11), A A A可逆的充要条件是 a 11 ≠ 0 a_{11}\neq 0 a11=0,故只要除以 a 11 a_{11} a11,就能化为单位矩阵。
假设 k k k阶可逆方阵都可以经过有限步初等列变换化为单位矩阵,考虑 k + 1 k+1 k+1阶可逆方阵
A = [ a 11 a 12 ⋯ a 1 k a 1 ( k + 1 ) a 21 a 22 ⋯ a 2 k a 2 ( k + 1 ) ⋯ a ( k + 1 ) 1 a ( k + 1 ) 2 ⋯ a ( k + 1 ) k a ( k + 1 ) ( k + 1 ) ] A= \left[ \begin{matrix} a_{11}&a_{12}&\cdots&a_{1k}&a_{1(k+1)}\\ a_{21}&a_{22}&\cdots&a_{2k}&a_{2(k+1)}\\ \cdots\\ a_{(k+1)1}&a_{(k+1)2}&\cdots&a_{(k+1)k}&a_{(k+1)(k+1)} \end{matrix} \right] A=⎣⎢⎢⎡a11a21⋯a(k+1)1a12a22a(k+1)2⋯⋯⋯a1ka2ka(k+1)ka1(k+1)a2(k+1)a(k+1)(k+1)⎦⎥⎥⎤
那么 a 11 , ⋯ , a 1 ( k + 1 ) a_{11},\cdots,a_{1(k+1)} a11,⋯,a1(k+1)必定不全为0,否则 r ( A ) ≠ k + 1 r(A)\neq k+1 r(A)=k+1。第一列除以 a 11 a_{11} a11,再第 i i i列加上第1列的 − a 1 i -a_{1i} −a1i倍,将矩阵化为
A 2 [ 1 0 ⋯ 0 b 21 b 22 ⋯ b 2 ( k + 1 ) ⋯ b ( k + 1 ) 1 b ( k + 1 ) 2 ⋯ b ( k + 1 ) ( k + 1 ) ] A_2 \left[ \begin{matrix} 1&0&\cdots&0\\ b_{21}&b_{22}&\cdots&b_{2(k+1)}\\ \cdots\\ b_{(k+1)1}&b_{(k+1)2}&\cdots&b_{(k+1)(k+1)} \end{matrix} \right] A2⎣⎢⎢⎡1b21⋯b(k+1)10b22b(k+1)2⋯⋯⋯0b2(k+1)b(k+1)(k+1)⎦⎥⎥⎤再令
B = [ b 22 ⋯ b 2 ( k + 1 ) ⋯ b ( k + 1 ) 2 ⋯ b ( k + 1 ) ( k + 1 ) ] B=\left[ \begin{matrix} b_{22}&\cdots&b_{2(k+1)}\\ \cdots\\ b_{(k+1)2}&\cdots&b_{(k+1)(k+1)} \end{matrix} \right] B=⎣⎡b22⋯b(k+1)2⋯⋯b2(k+1)b(k+1)(k+1)⎦⎤则 B B B一定可逆,否则 r ( A ) < k + 1 r(A)<k+1 r(A)<k+1,则由归纳假设,可以仅仅通过对 A 2 A_2 A2后 k k k列进行初等列变换,将 A 2 A_2 A2化为
A 3 = [ 1 0 ⋯ 0 b 21 1 b 31 1 ⋯ b ( k + 1 ) 1 1 ] A_3=\left[ \begin{matrix} 1&0&\cdots&&0\\ b_{21}&1&&&\\ b_{31}&&1&&\\ \cdots\\ b_{(k+1)1}&&&&1 \end{matrix} \right] A3=⎣⎢⎢⎢⎢⎡1b21b31⋯b(k+1)101⋯101⎦⎥⎥⎥⎥⎤
A 3 A_3 A3的第 1 1 1列加上第 i i i列的 − b i 1 -b_{i1} −bi1倍即可将 A 3 A_3 A3化为单位矩阵 ( i = 2 , ⋯ , k + 1 ) (i=2,\cdots,k+1) (i=2,⋯,k+1)
由数学归纳法,结论成立
引理2.4 任何可逆矩阵都可表为有限个初等矩阵的乘积
证:
设 A A A可逆,则 r ( A ) = n r(A)=n r(A)=n,则 A A A可以经过有限步初等列变换化为 I n I_n In,也就是说,存在初等矩阵 E 1 , ⋯ , E m E_1,\cdots,E_m E1,⋯,Em,使得
A E 1 ⋯ E m = I n AE_1\cdots E_m=I_n AE1⋯Em=In于是
A = E m − 1 ⋯ E 1 − 1 A=E_m^{-1}\cdots E_1^{-1} A=Em−1⋯E1−1 E 1 − 1 , ⋯ , E m − 1 E_1^{-1},\cdots,E_m^{-1} E1−1,⋯,Em−1都是初等矩阵
下面证明定理2.11:
证:
由 A A A可逆,存在有限个初等矩阵 E 1 , ⋯ , E m E_1,\cdots,E_m E1,⋯,Em,使得 A = E 1 ⋯ E m A=E_1\cdots E_m A=E1⋯Em因此
E 1 ⋯ E m A − 1 = I n E_1\cdots E_mA^{-1} = I_n E1⋯EmA−1=In于是,就有
A − 1 = E m − 1 ⋯ E 1 − 1 A^{-1}=E_m^{-1}\cdots E_1^{-1} A−1=Em−1⋯E1−1因此
A − 1 A = E m − 1 ⋯ E 1 − 1 E 1 ⋯ E m = I n A^{-1}A=E_m^{-1}\cdots E_1^{-1} E_1 \cdots E_m=I_n A−1A=Em−1⋯E1−1E1⋯Em=In第二个等号是通过重复使用矩阵乘法的结合律得到的
这样,逆矩阵实际上就是 M n M_n Mn上的一种运算,下面,我们给出逆运算和矩阵乘法
定理2.12
A
,
B
A,B
A,B都是
n
n
n阶可逆方阵,则
A
B
AB
AB也可逆,并且
(
A
B
)
−
1
=
B
−
1
A
−
1
(AB)^{-1}=B^{-1}A^{-1}
(AB)−1=B−1A−1
证:
要证明 A B AB AB可逆,只需要证明齐次方程组 A B x = 0 ABx=0 ABx=0只有零解,实际上,由 A A A可逆,故方程组
A y = 0 Ay=0 Ay=0只有零解,于是
B x = 0 Bx=0 Bx=0而 B B B可逆,故 x = 0 x=0 x=0,因此 A B AB AB可逆,同时
A B B − 1 A − 1 = A ( B B − 1 ) A − 1 = A A − 1 = I n ABB^{-1}A^{-1}=A(BB^{-1})A^{-1}=AA^{-1}=I_n ABB−1A−1=A(BB−1)A−1=AA−1=In因此
( A B ) − 1 = B − 1 A − 1 (AB)^{-1}=B^{-1}A^{-1} (AB)−1=B−1A−1
定理2.13
A
A
A是
n
n
n阶可逆方阵,则
A
T
A^T
AT也可逆,并且
(
A
T
)
−
1
=
(
A
−
1
)
T
(A^T)^{-1}=(A^{-1})^T
(AT)−1=(A−1)T
证:
由于转置不改变矩阵的秩,因此 A T A^T AT也可逆。同时
A T ( A − 1 ) T = ( A − 1 A ) T = I n T = I n A^T(A^{-1})^T=(A^{-1}A)^T=I_n^T=I_n AT(A−1)T=(A−1A)T=InT=In
我们再回到线性方程组求解的问题上,
A
A
A是
n
n
n阶方阵,如果
A
A
A可逆,那么对于任意的
b
∈
K
n
b\in K^n
b∈Kn,方程组
A
x
=
b
Ax=b
Ax=b两边左乘
A
−
1
A^{-1}
A−1,就可以求得方程组的解
x
=
A
−
1
b
x=A^{-1}b
x=A−1b这是方程组解的矩阵表示。
矩阵的运算与矩阵的秩
本节,我们来讨论矩阵的加法、数乘、乘法和矩阵的秩的关系。在这之前,我们先给出一个简单的命题。
命题2.1
x
1
,
⋯
,
x
n
,
y
1
,
⋯
,
y
m
∈
K
n
x_1,\cdots,x_n,y_1,\cdots,y_m\in K^n
x1,⋯,xn,y1,⋯,ym∈Kn,如果
x
1
,
⋯
,
x
n
x_1,\cdots,x_n
x1,⋯,xn能被
y
1
,
⋯
,
y
m
y_1,\cdots,y_m
y1,⋯,ym线性表示,那么
x
=
(
x
1
,
⋯
,
x
n
)
x=(x_1,\cdots,x_n)
x=(x1,⋯,xn)的秩不超过
y
=
(
y
1
,
⋯
,
y
m
)
y=(y_1,\cdots,y_m)
y=(y1,⋯,ym)的秩
证:
设 x 1 , ⋯ , x r x_1,\cdots,x_r x1,⋯,xr为 x x x的极大线性无关组, y 1 , ⋯ , y s y_1,\cdots,y_s y1,⋯,ys是 y y y的极大线性无关组。则 x 1 , ⋯ , x r x_1,\cdots,x_r x1,⋯,xr能被 y 1 , ⋯ , y s y_1,\cdots,y_s y1,⋯,ys线性表示, r ≤ s r\le s r≤s
定理2.14
A
,
B
∈
M
m
,
n
A,B\in M_{m,n}
A,B∈Mm,n,则
r
(
A
+
B
)
≤
r
(
A
)
+
r
(
B
)
r(A+B)\le r(A)+r(B)
r(A+B)≤r(A)+r(B)
证:
设 a 1 , ⋯ , a n a_1,\cdots,a_n a1,⋯,an是 A A A的列向量组, b 1 , ⋯ , b n b_1,\cdots,b_n b1,⋯,bn是 B B B的列向量组,则
a 1 + b 1 , ⋯ , a n + b n a_1+b_1,\cdots,a_n+b_n a1+b1,⋯,an+bn是 A + B A+B A+B的列向量组,则该向量组能被
a 1 , ⋯ , a n , b 1 , ⋯ , b n a_1,\cdots,a_n,b_1,\cdots,b_n a1,⋯,an,b1,⋯,bn线性表示,而设 a 1 , ⋯ , a r a_1,\cdots,a_r a1,⋯,ar是 A A A的列极大线性无关组, b 1 , ⋯ , b s b_1,\cdots,b_s b1,⋯,bs是 B B B的列极大线性无关组,因此
r ( A + B ) ≤ r ( a 1 , ⋯ , a n , b 1 , ⋯ , b n ) r(A+B)\le r(a_1,\cdots,a_n,b_1,\cdots,b_n) r(A+B)≤r(a1,⋯,an,b1,⋯,bn)
r ( a 1 , ⋯ , a n , b 1 , ⋯ , b n ) ≤ r ( a 1 , ⋯ , a r , b 1 , ⋯ , b s ) ≤ r + s r(a_1,\cdots,a_n,b_1,\cdots,b_n)\le r(a_1,\cdots,a_r,b_1,\cdots,b_s)\le r+s r(a1,⋯,an,b1,⋯,bn)≤r(a1,⋯,ar,b1,⋯,bs)≤r+s
定理2.15
A
∈
M
m
,
k
,
B
∈
M
k
,
n
A\in M_{m,k},B\in M_{k,n}
A∈Mm,k,B∈Mk,n,则
r
(
A
B
)
≤
min
(
r
(
A
)
,
r
(
B
)
)
r(AB)\le \min(r(A),r(B))
r(AB)≤min(r(A),r(B))
证:
设 B B B的列向量组为 b 1 , ⋯ , b n b_1,\cdots,b_n b1,⋯,bn,极大线性无关组为 b 1 ′ , ⋯ , b r ′ b_1^\prime,\cdots,b_r^\prime b1′,⋯,br′,则 A B AB AB的列向量组为 A b 1 , ⋯ , A b n Ab_1,\cdots,Ab_n Ab1,⋯,Abn,那么
A b 1 , ⋯ , A b n Ab_1,\cdots,Ab_n Ab1,⋯,Abn能被
A b 1 ′ , ⋯ , A b r ′ Ab_1^\prime,\cdots,Ab_r^\prime Ab1′,⋯,Abr′线性表示,因此
r ( A B ) ≤ r ( B ) r(AB)\le r(B) r(AB)≤r(B)设 A A A的行向量组为 a 1 , ⋯ , a m a_1,\cdots,a_m a1,⋯,am,极大线性无关组为 a 1 ′ , ⋯ , a s ′ a_1^\prime,\cdots,a_s^\prime a1′,⋯,as′,则 A B AB AB的行向量组为 a 1 B , ⋯ , a m B a_1B,\cdots,a_mB a1B,⋯,amB,那么
a 1 B , ⋯ , a m B a_1B,\cdots,a_mB a1B,⋯,amB能被
a 1 ′ B , ⋯ , a s ′ B a_1^\prime B,\cdots,a_s^\prime B a1′B,⋯,as′B线性表示,因此
r ( A B ) ≤ r ( A ) r(AB)\le r(A) r(AB)≤r(A)
定理2.16
A
∈
M
m
,
n
,
B
∈
M
n
,
t
A\in M_{m,n},B\in M_{n,t}
A∈Mm,n,B∈Mn,t,则
r
(
A
B
)
≥
r
(
A
)
+
r
(
B
)
−
n
r(AB)\ge r(A)+r(B)-n
r(AB)≥r(A)+r(B)−n
证:
设 B B B的列向量组为 b 1 , ⋯ , b t b_1,\cdots,b_t b1,⋯,bt, r 1 = r ( B ) r_1=r(B) r1=r(B),那么 A b 1 , ⋯ , A b t Ab_1,\cdots,Ab_t Ab1,⋯,Abt是 A B AB AB的列向量组,再设 A b 1 ′ , ⋯ , A b r 1 ′ Ab_1^\prime,\cdots,Ab_{r_1}^\prime Ab1′,⋯,Abr1′是 A b 1 , ⋯ , A b t Ab_1,\cdots,Ab_t Ab1,⋯,Abt的极大线性无关组,于是, A b i Ab_i Abi能被 A b 1 ′ , ⋯ , A b r 1 ′ Ab_1^\prime,\cdots,Ab_{r_1}^\prime Ab1′,⋯,Abr1′线性表示。设
A b i = k i 1 A b 1 ′ + ⋯ + k i r 1 A b r 1 ′ Ab_i = k_{i1}Ab_1^\prime+\cdots+k_{ir_1}Ab_{r_1}^\prime Abi=ki1Ab1′+⋯+kir1Abr1′则 b i − k i 1 b 1 ′ + ⋯ − k i r 1 b r 1 ′ b_i-k_{i1}b_1^\prime+\cdots-k_{ir_1}b_{r_1}^\prime bi−ki1b1′+⋯−kir1br1′是齐次方程组 A y = 0 Ay=0 Ay=0的解,设 P 1 , ⋯ , P r 2 P_1,\cdots,P_{r_2} P1,⋯,Pr2是其基础解系,则
b i = k i 1 b 1 ′ + k i r 1 b r 1 ′ + k i 1 ′ P 1 + ⋯ + k i r 2 ′ P r 2 b_i=k_{i1}b_1^\prime+k_{ir_1}b_{r_1}^\prime+k_{i1}^\prime P_1+\cdots+k_{ir_2}^\prime P_{r_2} bi=ki1b1′+kir1br1′+ki1′P1+⋯+kir2′Pr2因此
r ( B ) ≤ r ( A B ) + n − r ( A ) r(B)\le r(AB)+n-r(A) r(B)≤r(AB)+n−r(A)
向量空间的基与基变换
本节的最后,我们来补充向量空间上的基和基变换的相关理论。我们知道在平面上任意两个线性无关的向量可以线性表示平面上所有向量,空间上任意三个线性无关的向量可以线性表示空间上所有的向量,当然,这对于 n n n维向量空间也是成立的。
定理2.17 K n K^n Kn上任意 n n n个线性无关的向量可以唯一线性表示 K n K^n Kn的所有向量
证:
对任意的 β ∈ K n \beta\in K^n β∈Kn, a 1 , ⋯ , a n a_1,\cdots,a_n a1,⋯,an是 K n K^n Kn中 n n n个线性无关的向量, β \beta β能被\ a 1 , ⋯ , a n a_1,\cdots,a_n a1,⋯,an,等价于方程组
a 1 x 1 + ⋯ + a n x n = β a_1x_1+\cdots+a_nx_n=\beta a1x1+⋯+anxn=β有解,并且表示的系数是方程组的解,令 A = ( a 1 , ⋯ , a n ) A=(a_1,\cdots,a_n) A=(a1,⋯,an),方程组等价于
A x = β Ax=\beta Ax=β则由于 r ( A ) = n r(A)=n r(A)=n,因此, A A A可逆,并且
x = A − 1 β x=A^{-1}\beta x=A−1β方程组有解并且解是唯一的
现在我们有两组基
a
1
,
⋯
,
a
n
a_1,\cdots,a_n
a1,⋯,an和
b
1
,
⋯
,
b
n
b_1,\cdots,b_n
b1,⋯,bn,由于
b
1
,
⋯
,
b
n
b_1,\cdots,b_n
b1,⋯,bn是
K
n
K^n
Kn的一组基,那么
a
1
,
⋯
,
a
n
a_1,\cdots,a_n
a1,⋯,an能被
b
1
,
⋯
,
b
n
b_1,\cdots,b_n
b1,⋯,bn唯一线性表示,令
{
a
1
=
k
11
b
1
+
⋯
+
k
1
n
b
n
⋯
a
n
=
k
n
1
b
1
+
⋯
+
k
n
n
b
n
\begin{cases} a_1 = k_{11}b_1+\cdots+k_{1n}b_n\\ \cdots\\ a_n=k_{n1}b_1+\cdots+k_{nn}b_n \end{cases}
⎩⎪⎨⎪⎧a1=k11b1+⋯+k1nbn⋯an=kn1b1+⋯+knnbn则
(
a
1
,
⋯
,
a
n
)
=
(
b
1
,
⋯
,
b
n
)
[
k
11
⋯
k
n
1
⋯
⋯
⋯
k
1
n
⋯
k
n
n
]
(a_1,\cdots,a_n)=(b_1,\cdots,b_n)\left[ \begin{matrix} k_{11}&\cdots&k_{n1}\\ \cdots&\cdots&\cdots\\ k_{1n}&\cdots&k_{nn} \end{matrix} \right]
(a1,⋯,an)=(b1,⋯,bn)⎣⎡k11⋯k1n⋯⋯⋯kn1⋯knn⎦⎤令
K
=
[
k
11
⋯
k
n
1
⋯
⋯
⋯
k
1
n
⋯
k
n
n
]
K=\left[ \begin{matrix} k_{11}&\cdots&k_{n1}\\ \cdots&\cdots&\cdots\\ k_{1n}&\cdots&k_{nn} \end{matrix} \right]
K=⎣⎡k11⋯k1n⋯⋯⋯kn1⋯knn⎦⎤
K
K
K称为基变换矩阵,给定一组基
b
1
,
⋯
,
b
n
b_1,\cdots,b_n
b1,⋯,bn,对任意
x
∈
K
n
x\in K^n
x∈Kn,都存在
x
1
,
⋯
,
x
n
x_1,\cdots,x_n
x1,⋯,xn,
x
=
x
1
b
1
+
⋯
+
x
n
b
n
x=x_1b_1+\cdots+x_nb_n
x=x1b1+⋯+xnbn。
(
x
1
,
⋯
,
x
n
)
(x_1,\cdots,x_n)
(x1,⋯,xn)称为
x
x
x在基
b
1
,
⋯
,
b
n
b_1,\cdots,b_n
b1,⋯,bn下的坐标。假设
K
K
K是
b
1
,
⋯
,
b
n
b_1,\cdots,b_n
b1,⋯,bn到
a
1
,
⋯
,
a
n
a_1,\cdots,a_n
a1,⋯,an的基变换矩阵,
x
∈
K
n
x\in K^n
x∈Kn,在
b
1
,
⋯
,
b
n
b_1,\cdots,b_n
b1,⋯,bn下坐标向量为
y
y
y,在
a
1
,
⋯
,
a
n
a_1,\cdots,a_n
a1,⋯,an下坐标向量为
z
z
z,则令
B
=
(
b
1
,
⋯
,
b
n
)
,
A
=
(
a
1
,
⋯
,
a
n
)
B=(b_1,\cdots,b_n),A=(a_1,\cdots,a_n)
B=(b1,⋯,bn),A=(a1,⋯,an),就有
B
=
A
K
B=AK
B=AK
x
=
B
y
=
A
K
y
=
A
z
x=By=AKy=Az
x=By=AKy=Az由坐标的唯一性
K
y
=
z
Ky=z
Ky=z因此,左乘
K
K
K就能将
b
1
,
⋯
,
b
n
b_1,\cdots,b_n
b1,⋯,bn下的坐标转换为
a
1
,
⋯
,
a
n
a_1,\cdots,a_n
a1,⋯,an下的坐标,这就是
K
n
K^n
Kn下的坐标变换公式
分块矩阵的乘法及求逆
分块矩阵是常用的计算矩阵的手法。所谓分块就是将矩阵划分为若干块,每一块都是一个子矩阵,即
A
=
[
A
11
A
12
⋯
A
1
n
A
21
A
22
⋯
A
2
n
⋯
⋯
⋯
⋯
A
m
1
A
m
2
⋯
A
m
n
]
A=\left[ \begin{matrix} A_{11}&A_{12}&\cdots&A_{1n}\\ A_{21}&A_{22}&\cdots&A_{2n}\\ \cdots&\cdots&\cdots&\cdots\\ A_{m1}&A_{m2}&\cdots&A_{mn} \end{matrix} \right]
A=⎣⎢⎢⎡A11A21⋯Am1A12A22⋯Am2⋯⋯⋯⋯A1nA2n⋯Amn⎦⎥⎥⎤其中
A
i
j
A_{ij}
Aij是
m
i
×
n
j
m_i\times n_j
mi×nj矩阵,那么
A
A
A就是
M
=
∑
i
=
1
m
m
i
M=\sum_{i=1}^m{m_i}
M=∑i=1mmi行
N
=
∑
j
=
1
n
n
i
N=\sum_{j=1}^n{n_i}
N=∑j=1nni列矩阵,对矩阵进行分块之后,求矩阵的乘法,我们就可以利用各个击破的方法,再设
B
=
[
B
11
B
12
⋯
B
1
t
⋯
⋯
⋯
⋯
B
n
1
B
n
2
⋯
B
n
t
]
B=\left[ \begin{matrix} B_{11}&B_{12}&\cdots&B_{1t}\\ \cdots&\cdots&\cdots&\cdots\\ B_{n1}&B_{n2}&\cdots&B_{nt} \end{matrix} \right]
B=⎣⎡B11⋯Bn1B12⋯Bn2⋯⋯⋯B1t⋯Bnt⎦⎤其中
B
i
j
B_{ij}
Bij是
n
i
×
t
j
n_i\times t_j
ni×tj矩阵,那么,就有
A
B
=
[
∑
s
=
1
n
A
1
s
B
s
1
∑
s
=
1
n
A
1
s
B
s
2
⋯
∑
s
=
1
n
A
1
s
B
s
t
⋯
⋯
⋯
⋯
∑
s
=
1
n
A
m
s
B
s
1
∑
s
=
1
n
A
m
s
B
s
2
⋯
∑
s
=
1
n
A
m
s
B
s
t
]
AB=\left[\begin{matrix} \sum_{s=1}^n{A_{1s}B_{s1}}&\sum_{s=1}^n{A_{1s}B_{s2}}&\cdots&\sum_{s=1}^n{A_{1s}B_{st}}\\ \cdots&\cdots&\cdots&\cdots\\ \sum_{s=1}^n{A_{ms}B_{s1}}&\sum_{s=1}^n{A_{ms}B_{s2}}&\cdots&\sum_{s=1}^n{A_{ms}B_{st}} \end{matrix}\right]
AB=⎣⎡∑s=1nA1sBs1⋯∑s=1nAmsBs1∑s=1nA1sBs2⋯∑s=1nAmsBs2⋯⋯⋯∑s=1nA1sBst⋯∑s=1nAmsBst⎦⎤这是因为,设
A
B
=
(
c
i
j
)
AB=(c_{ij})
AB=(cij),
c
i
j
c_{ij}
cij只与
A
A
A中
i
i
i行所在行有交集的块以及
B
B
B中
j
j
j列有交集的块有关,再经过形式复杂但比较初等的验证之后就有以上的结论。对角矩阵即形如
[
a
1
a
2
⋯
a
n
]
\left[\begin{matrix} a_1\\ &a_2\\ &&\cdots\\ &&&a_n \end{matrix}\right]
⎣⎢⎢⎡a1a2⋯an⎦⎥⎥⎤的矩阵,记为
d
i
a
g
(
a
1
,
⋯
,
a
n
)
diag(a_1,\cdots,a_n)
diag(a1,⋯,an),单位矩阵就是一种特殊的对角矩阵,如果
a
1
,
⋯
,
a
n
≠
0
a_1,\cdots,a_n\neq 0
a1,⋯,an=0,那么其逆矩阵就是
d
i
a
g
(
a
1
−
1
,
⋯
,
a
n
−
1
)
diag(a_1^{-1},\cdots,a_n^{-1})
diag(a1−1,⋯,an−1)类似地,我们可以将对角矩阵推广成准对角矩阵
[
A
1
A
2
⋯
A
n
]
\left[\begin{matrix} A_1\\ &A_2\\ &&\cdots\\ &&&A_n \end{matrix}\right]
⎣⎢⎢⎡A1A2⋯An⎦⎥⎥⎤只不过这里
A
i
A_i
Ai是
n
i
n_i
ni阶的可逆方阵,同样地,其逆矩阵为
[
A
1
−
1
A
2
−
1
⋯
A
n
−
1
]
\left[ \begin{matrix} A_1^{-1}\\ &A_2^{-1}\\ &&\cdots\\ &&&A_n^{-1} \end{matrix} \right]
⎣⎢⎢⎡A1−1A2−1⋯An−1⎦⎥⎥⎤对于准对角矩阵
[
A
1
A
2
⋯
A
n
]
\left[\begin{matrix} A_1\\ &A_2\\ &&\cdots\\ &&&A_n \end{matrix}\right]
⎣⎢⎢⎡A1A2⋯An⎦⎥⎥⎤其秩就等于
∑
i
=
1
n
r
(
A
i
)
\sum_{i=1}^n{r(A_i)}
∑i=1nr(Ai)这样,分块之后,求秩和求逆矩阵就可以逐个击破,分别求解。
定理2.18 给定数域
K
K
K上的分块矩阵
M
=
[
A
C
0
B
]
M= \left[ \begin{matrix} A&C\\ 0&B \end{matrix} \right]
M=[A0CB]有
r
(
A
)
+
r
(
B
)
≤
r
(
M
)
r(A)+r(B) \le r(M)
r(A)+r(B)≤r(M)
证:
设 A A A的列向量组为 a 1 , ⋯ , a s a_1,\cdots,a_s a1,⋯,as, C C C的列向量组为 c 1 , ⋯ , c t c_1,\cdots,c_t c1,⋯,ct, B B B的列向量组为 b 1 , ⋯ , b t b_1,\cdots,b_t b1,⋯,bt,则 M M M的列向量组为
d 1 , ⋯ , d s , d s + 1 , ⋯ , d s + t d_1,\cdots,d_s,d_{s+1},\cdots,d_{s+t} d1,⋯,ds,ds+1,⋯,ds+t其中
d i = [ a i 0 ] ( i = 1 , ⋯ , s ) d_i = \left[ \begin{matrix} a_i\\ 0 \end{matrix} \right](i=1,\cdots,s) di=[ai0](i=1,⋯,s) d s + i = [ c i b i ] ( i = 1 , ⋯ , t ) d_{s+i}=\left[ \begin{matrix} c_{i}\\ b_{i} \end{matrix} \right](i=1,\cdots,t) ds+i=[cibi](i=1,⋯,t)设 a 1 , ⋯ , a s a_1,\cdots,a_s a1,⋯,as的极大线性无关组为 a n 1 , ⋯ , a n r 1 a_{n_1},\cdots,a_{n_{r_1}} an1,⋯,anr1
, b 1 , ⋯ , b t b_1,\cdots,b_t b1,⋯,bt的极大线性无关组为 b m 1 , ⋯ , b m r 2 b_{m_1},\cdots,b_{m_{r_2}} bm1,⋯,bmr2。\
则 d n 1 , ⋯ , d n r 1 , d s + m 1 , ⋯ , d s + m r 2 d_{n_1},\cdots,d_{n_{r_1}},d_{s+m_1},\cdots,d_{s+m_{r_2}} dn1,⋯,dnr1,ds+m1,⋯,ds+mr2也是线性无关的,
并且能被 d 1 , ⋯ , d s + t d_1,\cdots,d_{s+t} d1,⋯,ds+t线性表示,因此
r ( M ) ≥ r 1 + r 2 = r ( A ) + r ( B ) r(M)\ge r_1+r_2=r(A)+r(B) r(M)≥r1+r2=r(A)+r(B)