线性代数中的线性方程组
1.4 矩阵方程 A x = b Ax=b Ax=b
线性代数中一个基本的思想是把向量的线性组合看作矩阵与向量的积.
定义 若 A A A是 m × n m\times n m×n矩阵,它的各列为 a 1 , ⋯ , a n a_1,\cdots,a_n a1,⋯,an.若 x x x是 R n \mathbb{R}^n Rn中的向量,则 A A A与 x x x的积(记为 A x Ax Ax)就是 A A A的各列以 x x x中对应元素为权的线性组合,即
A x = [ a 1 a 2 ⋯ a n ] [ x 1 x 2 ⋮ x n ] = x 1 a 1 + x 2 a 2 + ⋯ + x n a n Ax=\begin{bmatrix} a_1&a_2&\cdots &a_n \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \\ \vdots \\x_n \end{bmatrix} = x_1a_1+x_2a_2+\cdots+x_na_n Ax=[a1a2⋯an] x1x2⋮xn =x1a1+x2a2+⋯+xnan
注意 A x Ax Ax仅当 A A A的列数等于 x x x中的元素个数时才有定义.
例1 对
R
n
\mathbb{R}^n
Rn中的
v
1
,
v
2
,
v
3
v_1,v_2,v_3
v1,v2,v3,把线性组合
3
v
1
−
5
v
2
+
7
v
3
3v_1-5v_2+7v_3
3v1−5v2+7v3表示为矩阵向量相乘的形式.
把
v
1
,
v
2
,
v
3
v_1,v_2,v_3
v1,v2,v3排成矩阵
A
A
A,把数
3
,
−
5
,
7
3,-5,7
3,−5,7排成向量
x
x
x,即
3
v
1
−
5
v
2
+
7
v
3
=
[
v
1
v
2
v
3
]
[
3
−
5
7
]
=
A
x
3v_1-5v_2+7v_3=\begin{bmatrix} v_1&v_2&v_3 \end{bmatrix} \begin{bmatrix} 3 \\ -5 \\ 7 \end{bmatrix}=Ax
3v1−5v2+7v3=[v1v2v3]
3−57
=Ax
可以将线性方程组写成包含向量的线性组合的向量方程.例如:
{
x
1
+
2
x
2
−
x
3
=
4
−
5
x
2
+
3
x
3
=
1
(1)
\left \{ \begin{array}{c} x_1+2x_2-x_3=4 \\ \tag{1} -5x_2+3x_3=1 \end{array} \right.
{x1+2x2−x3=4−5x2+3x3=1(1)
等价于
x
1
[
1
0
]
+
x
2
[
2
−
5
]
+
x
3
[
−
1
3
]
=
[
4
1
]
(2)
x_1\begin{bmatrix} 1 \\ 0 \end{bmatrix} + x_2\begin{bmatrix} 2 \\ -5 \end{bmatrix} + x_3\begin{bmatrix} -1 \\ 3 \end{bmatrix} = \begin{bmatrix} 4 \\ 1 \end{bmatrix} \tag{2}
x1[10]+x2[2−5]+x3[−13]=[41](2)
也可以将方程左边的线性组合写成矩阵乘向量的形式,(2)成为
[
1
2
−
1
0
−
5
3
]
[
x
1
x
2
x
3
]
=
[
4
1
]
(3)
\begin{bmatrix} 1&2&-1 \\ 0&-5&3 \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \\ x_3 \end{bmatrix} = \begin{bmatrix} 4 \\ 1 \end{bmatrix} \tag{3}
[102−5−13]
x1x2x3
=[41](3)
方程(3)有形式
A
x
=
b
Ax=b
Ax=b,称这样的方程为矩阵方程,以区别于(2)式那样的向量方程.
注意(3)中的矩阵仅是方程(1)中的系数矩阵.任何线性方程组或类似(2)式的向量方程都可以写成等价的形式
A
x
=
b
Ax=b
Ax=b的矩阵方程.
定理3 若 A A A是 m × n m\times n m×n矩阵,它的各列为 a 1 , ⋯ , a n a_1,\cdots ,a_n a1,⋯,an,而 b b b属于 R m \mathbb{R}^m Rm,则矩阵方程
A x = b (4) Ax=b \tag{4} Ax=b(4)
与向量方程
x 1 a 1 + x 2 a 2 + ⋯ + x n a n = b (5) x_1a_1+x_2a_2+\cdots +x_na_n=b \tag{5} x1a1+x2a2+⋯+xnan=b(5)
有相同的解集.它又与增广矩阵为
[ a 1 a 2 ⋯ a n b ] (6) \begin{bmatrix} a_1&a_2&\cdots&a_n&b \end{bmatrix} \tag{6} [a1a2⋯anb](6)
的线性方程组有相同的解集.
解的存在性
A x Ax Ax的定义直接导致下列有用的事实.
方程 A x = b Ax=b Ax=b有解当且仅当 b b b是 A A A的各列的线性组合.
在1.3节中,考虑了存在性问题,即“ b b b是否属于 S p a n { a 1 , ⋯ , a n } ? Span\lbrace a_1,\cdots ,a_n\rbrace? Span{a1,⋯,an}?”,等价地,“ A x = b Ax=b Ax=b是否相容?”.一个更困难的问题是要确定方程 A x = b Ax=b Ax=b对任意的 b b b是否有解.
例2 设 A = [ 1 3 4 − 4 2 − 6 − 3 − 2 − 7 ] , b = [ b 1 b 2 b 3 ] A=\begin{bmatrix} 1&3&4 \\ -4&2&-6 \\ -3&-2&-7 \end{bmatrix},b=\begin{bmatrix} b_1 \\ b_2 \\ b_3 \end{bmatrix} A= 1−4−332−24−6−7 ,b= b1b2b3 .方程 A x = b Ax=b Ax=b是否对一切可能 b 1 , b 2 , b 3 b_1,b_2,b_3 b1,b2,b3有解?
将
A
x
=
b
Ax=b
Ax=b的增广矩阵进行行化简:
[
1
3
4
b
1
−
4
2
−
6
b
2
−
3
−
2
−
7
b
3
]
∽
[
1
3
4
b
1
0
14
10
4
b
1
+
b
2
0
7
5
3
b
1
+
b
3
]
∽
[
1
3
4
b
1
0
14
10
4
b
1
+
b
2
0
0
0
b
1
+
b
3
−
1
2
b
2
]
\begin{bmatrix} 1&3&4&b_1 \\ -4&2&-6&b_2 \\ -3&-2&-7&b_3 \end{bmatrix} \backsim \begin{bmatrix} 1&3&4&b_1 \\ 0&14&10&4b_1+b_2 \\ 0&7&5&3b_1+b_3 \end{bmatrix} \backsim \begin{bmatrix} 1&3&4&b_1 \\ 0&14&10&4b_1+b_2 \\ 0&0&0&b_1+b_3-\frac{1}{2}b_2 \end{bmatrix}
1−4−332−24−6−7b1b2b3
∽
10031474105b14b1+b23b1+b3
∽
10031404100b14b1+b2b1+b3−21b2
第4列的第3个元素为
b
1
+
b
3
−
1
2
b
2
b_1+b_3-\frac{1}{2}b_2
b1+b3−21b2.方程
A
x
=
b
Ax=b
Ax=b并不是对一切的
b
b
b都相容,因为
b
1
+
b
3
−
1
2
b
2
b_1+b_3-\frac{1}{2}b_2
b1+b3−21b2可能不为零.
例2中的简化矩阵描述了使方程
A
x
=
b
Ax=b
Ax=b相容的所有
b
b
b的集合:
b
b
b必须满足
b
1
−
1
2
b
2
+
b
3
=
0
b_1-\frac{1}{2}b_2+b_3=0
b1−21b2+b3=0
这是
R
3
\mathbb{R}^3
R3中一个通过原点的平面,这个平面就是
A
A
A的3列所有线性组合的集合.
例2中的方程
A
x
=
b
Ax=b
Ax=b并非对所有的
b
b
b都相容,这是因为
A
A
A的阶梯形含有零行.假如A在所有三行都有主元素,就不必注意增广列的计算,因为这时增广矩阵的阶梯形不可能产生如
[
0
0
0
1
]
\begin{bmatrix} 0&0&0&1 \end{bmatrix}
[0001]的行.
称“A的列生成
R
m
\mathbb{R}^m
Rm”时,意思是说
R
m
\mathbb{R}^m
Rm中的每个向量
b
b
b都是
A
A
A的列的线性组合.一般地,
R
m
\mathbb{R}^m
Rm中向量集
S
p
a
n
{
v
1
,
⋯
,
v
p
}
Span\lbrace v_1,\cdots ,v_p\rbrace
Span{v1,⋯,vp}生成
R
m
\mathbb{R}^m
Rm的意思是,
R
m
\mathbb{R}^m
Rm中的每个向量都是
v
1
,
⋯
,
v
p
v_1,\cdots ,v_p
v1,⋯,vp的线性组合,即
S
p
a
n
{
v
1
,
⋯
,
v
p
}
=
R
m
Span \lbrace v_1,\cdots ,v_p\rbrace = \mathbb{R}^m
Span{v1,⋯,vp}=Rm.
定理4 设 A A A是 m × n m\times n m×n矩阵,则下列命题是逻辑上等价的.也就是说,对某个 A A A,它们都成立或者都不成立.
a.对 R m \mathbb{R}^m Rm中每个 b b b,方程 A x = b Ax=b Ax=b有解.
b. R m \mathbb{R}^m Rm中的每个 b b b都是 A A A的列的一个线性组合.
c. A A A的各列生成 R m \mathbb{R}^m Rm.
d. A A A在每一行都有一个主元位置.
命题(a)、(b)和(c)等价是根据 A x Ax Ax的定义和一组向量生成 R m \mathbb{R}^m Rm空间的含义而得到的.再根据例2的讨论得到命题(a)和(d)等价.
A x Ax Ax的计算
例3 计算 A x Ax Ax,其中 A = [ 2 3 4 − 1 5 − 3 6 − 2 8 ] , x = [ x 1 x 2 x 3 ] A=\begin{bmatrix} 2&3&4 \\ -1&5&-3 \\ 6&-2&8 \end{bmatrix},x=\begin{bmatrix} x_1 \\ x_2 \\ x_3 \end{bmatrix} A= 2−1635−24−38 ,x= x1x2x3
[ 2 3 4 − 1 5 − 3 6 − 2 8 ] [ x 1 x 2 x 3 ] = x 1 [ 2 − 1 6 ] + x 2 [ 3 5 − 2 ] + x 3 [ 4 − 3 8 ] \begin{bmatrix} 2&3&4 \\ -1&5&-3 \\ 6&-2&8 \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \\ x_3 \end{bmatrix} = x_1 \begin{bmatrix} 2 \\ -1 \\ 6 \end{bmatrix} + x_2 \begin{bmatrix} 3 \\ 5 \\ -2 \end{bmatrix} + x_3 \begin{bmatrix} 4 \\ -3 \\ 8 \end{bmatrix} 2−1635−24−38 x1x2x3 =x1 2−16 +x2 35−2 +x3 4−38
=
[
2
x
1
+
3
x
2
+
4
x
3
−
x
1
+
5
x
2
−
3
x
3
6
x
1
−
2
x
2
+
8
x
3
]
(7)
=\begin{bmatrix} 2x_1+3x_2+4x_3 \\ -x_1+5x_2-3x_3 \\ 6x_1-2x_2+8x_3 \end{bmatrix} \tag{7}
=
2x1+3x2+4x3−x1+5x2−3x36x1−2x2+8x3
(7)
矩阵
A
x
Ax
Ax的第一个元素是
A
A
A的第一行与
x
x
x中相应元素乘机之和(有时称为点积),即
[
2
3
4
]
[
x
1
x
2
x
3
]
=
[
2
x
1
+
3
x
2
+
4
x
3
]
\begin{bmatrix} 2&3&4 \\ \\ \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \\ x_3 \end{bmatrix} = \begin{bmatrix} 2x_1+3x_2+4x_3 \\ \\ \end{bmatrix}
[234]
x1x2x3
=[2x1+3x2+4x3]
此矩阵说明如何计算
A
x
Ax
Ax中的第一个元素,而不必像(7)那样写出所有运算步骤.
计算 A x Ax Ax的行-向量规则
若乘积 A x Ax Ax有定义,则 A x Ax Ax中的第 i i i个元素是 A A A的第 i i i行元素与 x x x的相应元素乘积之和.
例4
a
.
[
1
2
−
1
0
−
5
3
]
[
4
3
7
]
=
[
1
⋅
4
+
2
⋅
3
+
(
−
1
)
⋅
7
0
⋅
4
+
(
−
5
)
⋅
3
+
3
⋅
7
]
=
[
3
6
]
a. \begin{bmatrix} 1&2&-1 \\ 0&-5&3 \end{bmatrix} \begin{bmatrix} 4 \\ 3 \\ 7 \\ \end{bmatrix} = \begin{bmatrix} 1\cdot 4+2\cdot 3+(-1)\cdot 7 \\ 0\cdot 4+(-5)\cdot 3+3\cdot 7 \end{bmatrix} = \begin{bmatrix} 3 \\ 6 \end{bmatrix}
a.[102−5−13]
437
=[1⋅4+2⋅3+(−1)⋅70⋅4+(−5)⋅3+3⋅7]=[36]
b . [ 2 − 3 8 0 − 5 2 ] [ 4 7 ] = [ 2 ⋅ 4 + ( − 3 ) ⋅ 7 8 ⋅ 4 + 0 ⋅ 7 ( − 5 ) ⋅ 4 + 2 ⋅ 7 ] = [ − 13 32 − 6 ] b. \begin{bmatrix} 2&-3 \\ 8&0 \\ -5&2 \end{bmatrix} \begin{bmatrix} 4 \\ 7 \\ \end{bmatrix} = \begin{bmatrix} 2\cdot 4+(-3)\cdot 7 \\ 8\cdot 4+0\cdot 7 \\ (-5)\cdot 4+2\cdot 7 \end{bmatrix} = \begin{bmatrix} -13 \\ 32 \\ -6 \end{bmatrix} b. 28−5−302 [47]= 2⋅4+(−3)⋅78⋅4+0⋅7(−5)⋅4+2⋅7 = −1332−6
c . [ 1 0 0 0 1 0 0 0 1 ] [ r s t ] = [ 1 ⋅ r + 0 ⋅ s + 0 ⋅ t 0 ⋅ r + 1 ⋅ s + 0 ⋅ t 0 ⋅ r + 0 ⋅ s + 1 ⋅ t ] = [ r s t ] c. \begin{bmatrix} 1&0&0 \\ 0&1&0 \\ 0&0&1 \end{bmatrix} \begin{bmatrix} r \\ s \\ t \\ \end{bmatrix} = \begin{bmatrix} 1\cdot r+0\cdot s+0\cdot t \\ 0\cdot r+1\cdot s+0\cdot t \\ 0\cdot r+0\cdot s+1\cdot t \end{bmatrix} = \begin{bmatrix} r \\ s \\ t \\ \end{bmatrix} c. 100010001 rst = 1⋅r+0⋅s+0⋅t0⋅r+1⋅s+0⋅t0⋅r+0⋅s+1⋅t = rst
由定义,例4(c)中的矩阵的主对角线上元素为1,其它位置上元素为0,这个矩阵称为单位矩阵,并记为 I I I.(c)中的计算说明,对任意 R 3 \mathbb{R}^3 R3中的 x x x, I x = x Ix=x Ix=x.类似地,有 n × n n\times n n×n单位矩阵,有时记为 I n I_n In,如(c)中所示,对任意 R n \mathbb{R}^n Rn中的 x x x, I n x = x I_nx=x Inx=x.
矩阵-向量积 A x Ax Ax的性质
定理5 若 A A A是 m × n m\times n m×n矩阵, u u u和 v v v是 R n \mathbb{R}^n Rn中的向量, c c c是标量,则
a. A ( u + v ) = A u + A v A(u+v)=Au+Av A(u+v)=Au+Av.
b. A ( c u ) = c ( A u ) A(cu)=c(Au) A(cu)=c(Au).
为简单起见,取
n
=
3
n=3
n=3,
A
=
[
a
1
a
2
a
3
]
A=\begin{bmatrix} a_1&a_2&a_3 \end{bmatrix}
A=[a1a2a3],
u
,
v
u,v
u,v为
R
3
\mathbb{R}^3
R3中的向量.对
i
=
1
,
2
,
3
i=1,2,3
i=1,2,3,设
u
i
u_i
ui和
v
i
v_i
vi分别为
u
u
u和
v
v
v的第
i
i
i个元素.为证明(a),把
A
(
u
+
v
)
A(u+v)
A(u+v)作为
A
A
A的各列以
u
+
v
u+v
u+v的各元素为权的线性组合来计算.
A
(
u
+
v
)
=
[
a
1
a
2
a
3
]
[
u
1
+
v
1
u
2
+
v
2
u
3
+
v
3
]
=
(
u
1
+
v
1
)
a
1
+
(
u
2
+
v
2
)
a
2
+
(
u
3
+
v
3
)
a
3
A(u+v)= \begin{bmatrix} a_1&a_2&a_3 \end{bmatrix} \begin{bmatrix} u_1+v_1 \\ u_2+v_2 \\ u_3+v_3 \end{bmatrix}= (u_1+v_1)a_1 + (u_2+v_2)a_2 + (u_3+v_3)a_3
A(u+v)=[a1a2a3]
u1+v1u2+v2u3+v3
=(u1+v1)a1+(u2+v2)a2+(u3+v3)a3
= ( u 1 a 1 + u 2 a 2 + u 3 a 3 ) + ( v 1 a 1 + v 2 a 2 + v 3 a 3 ) = A u + A v = (u_1a_1+u_2a_2+u_3a_3) + (v_1a_1+v_2a_2+v_3a_3) = Au+Av =(u1a1+u2a2+u3a3)+(v1a1+v2a2+v3a3)=Au+Av
为证明(b),把 A ( c u ) A(cu) A(cu)作为A的各列以 c u cu cu的各元素为权的线性组合来计算.
A ( c u ) = [ a 1 a 2 a 3 ] [ c u 1 c u 2 c u 3 ] = ( c u 1 ) a 1 + ( c u 2 ) a 2 + ( c u 3 ) a 3 A(cu) = \begin{bmatrix} a_1&a_2&a_3 \end{bmatrix} \begin{bmatrix} cu_1 \\ cu_2 \\ cu_3 \end{bmatrix} = (cu_1)a_1 + (cu_2)a_2 + (cu_3)a_3 A(cu)=[a1a2a3] cu1cu2cu3 =(cu1)a1+(cu2)a2+(cu3)a3
= c ( u 1 a 1 ) + c ( u 2 a 2 ) + c ( u 3 a 3 ) = c ( u 1 a 1 + u 2 a 2 + u 3 a 3 ) = c ( A u ) = c(u_1a_1) + c(u_2a_2) + c(u_3a_3) = c(u_1a_1 + u_2a_2 + u_3a_3) = c(Au) =c(u1a1)+c(u2a2)+c(u3a3)=c(u1a1+u2a2+u3a3)=c(Au)
定理4的证明 如定理4后面所指出的,命题(a)、(b)和(c)逻辑上等价.因此,只需证明命题(a)和(d)同时为真,或同时为假,就可以建立四个命题的等价性.
设
U
U
U为
A
A
A的阶梯形.给定
R
m
\mathbb{R}^m
Rm中的
b
b
b,可以把增广矩阵
[
A
b
]
\begin{bmatrix} A&b \end{bmatrix}
[Ab]行化简为增广矩阵
[
U
d
]
\begin{bmatrix} U&d \end{bmatrix}
[Ud],
d
d
d为
R
m
\mathbb{R}^m
Rm中的某个向量.
[ A b ] ∽ ⋯ ∽ [ U d ] \begin{bmatrix} A&b \end{bmatrix} \backsim \cdots \backsim \begin{bmatrix} U&d \end{bmatrix} [Ab]∽⋯∽[Ud]
若(d)成立,则 U U U的每一行包含一个主元位置而在增广列中不可能有主元.故对任意 b b b, A x = b Ax=b Ax=b有解,(a)成立.若(d)不成立,则 U U U的最后一行都是0.设 d d d是最后一个元素为1的向量,于是 [ U d ] \begin{bmatrix} U&d \end{bmatrix} [Ud]代表一个不相容的方程组.因行变换是可逆的,故 [ U d ] \begin{bmatrix} U&d \end{bmatrix} [Ud]可变换为形如 [ A b ] \begin{bmatrix} A&b \end{bmatrix} [Ab]的矩阵,所得方程组 A x = b Ax=b Ax=b也是不相容的,(a)也不成立.