矩阵方程Ax=b

线性代数中的线性方程组

1.4 矩阵方程 A x = b Ax=b Ax=b

  线性代数中一个基本的思想是把向量的线性组合看作矩阵与向量的积.

定义 A A A m × n m\times n m×n矩阵,它的各列为 a 1 , ⋯   , a n a_1,\cdots,a_n a1,,an.若 x x x R n \mathbb{R}^n Rn中的向量,则 A A A x x x的积(记为 A x Ax Ax)就是 A A A的各列以 x x x中对应元素为权的线性组合,即
A x = [ a 1 a 2 ⋯ a n ] [ x 1 x 2 ⋮ x n ] = x 1 a 1 + x 2 a 2 + ⋯ + x n a n Ax=\begin{bmatrix} a_1&a_2&\cdots &a_n \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \\ \vdots \\x_n \end{bmatrix} = x_1a_1+x_2a_2+\cdots+x_na_n Ax=[a1a2an] x1x2xn =x1a1+x2a2++xnan

  注意 A x Ax Ax仅当 A A A的列数等于 x x x中的元素个数时才有定义.

例1 R n \mathbb{R}^n Rn中的 v 1 , v 2 , v 3 v_1,v_2,v_3 v1,v2,v3,把线性组合 3 v 1 − 5 v 2 + 7 v 3 3v_1-5v_2+7v_3 3v15v2+7v3表示为矩阵向量相乘的形式.
v 1 , v 2 , v 3 v_1,v_2,v_3 v1,v2,v3排成矩阵 A A A,把数 3 , − 5 , 7 3,-5,7 3,5,7排成向量 x x x,即
3 v 1 − 5 v 2 + 7 v 3 = [ v 1 v 2 v 3 ] [ 3 − 5 7 ] = A x 3v_1-5v_2+7v_3=\begin{bmatrix} v_1&v_2&v_3 \end{bmatrix} \begin{bmatrix} 3 \\ -5 \\ 7 \end{bmatrix}=Ax 3v15v2+7v3=[v1v2v3] 357 =Ax
  可以将线性方程组写成包含向量的线性组合的向量方程.例如:
{ x 1 + 2 x 2 − x 3 = 4 − 5 x 2 + 3 x 3 = 1 (1) \left \{ \begin{array}{c} x_1+2x_2-x_3=4 \\ \tag{1} -5x_2+3x_3=1 \end{array} \right. {x1+2x2x3=45x2+3x3=1(1)
等价于
x 1 [ 1 0 ] + x 2 [ 2 − 5 ] + x 3 [ − 1 3 ] = [ 4 1 ] (2) x_1\begin{bmatrix} 1 \\ 0 \end{bmatrix} + x_2\begin{bmatrix} 2 \\ -5 \end{bmatrix} + x_3\begin{bmatrix} -1 \\ 3 \end{bmatrix} = \begin{bmatrix} 4 \\ 1 \end{bmatrix} \tag{2} x1[10]+x2[25]+x3[13]=[41](2)
也可以将方程左边的线性组合写成矩阵乘向量的形式,(2)成为
[ 1 2 − 1 0 − 5 3 ] [ x 1 x 2 x 3 ] = [ 4 1 ] (3) \begin{bmatrix} 1&2&-1 \\ 0&-5&3 \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \\ x_3 \end{bmatrix} = \begin{bmatrix} 4 \\ 1 \end{bmatrix} \tag{3} [102513] x1x2x3 =[41](3)
  方程(3)有形式 A x = b Ax=b Ax=b,称这样的方程为矩阵方程,以区别于(2)式那样的向量方程.
  注意(3)中的矩阵仅是方程(1)中的系数矩阵.任何线性方程组或类似(2)式的向量方程都可以写成等价的形式 A x = b Ax=b Ax=b的矩阵方程.

定理3 A A A m × n m\times n m×n矩阵,它的各列为 a 1 , ⋯   , a n a_1,\cdots ,a_n a1,,an,而 b b b属于 R m \mathbb{R}^m Rm,则矩阵方程
A x = b (4) Ax=b \tag{4} Ax=b(4)
与向量方程
x 1 a 1 + x 2 a 2 + ⋯ + x n a n = b (5) x_1a_1+x_2a_2+\cdots +x_na_n=b \tag{5} x1a1+x2a2++xnan=b(5)
有相同的解集.它又与增广矩阵为
[ a 1 a 2 ⋯ a n b ] (6) \begin{bmatrix} a_1&a_2&\cdots&a_n&b \end{bmatrix} \tag{6} [a1a2anb](6)
的线性方程组有相同的解集.

解的存在性

   A x Ax Ax的定义直接导致下列有用的事实.

方程 A x = b Ax=b Ax=b有解当且仅当 b b b A A A的各列的线性组合.

  在1.3节中,考虑了存在性问题,即“ b b b是否属于 S p a n { a 1 , ⋯   , a n } ? Span\lbrace a_1,\cdots ,a_n\rbrace? Span{a1,,an}?”,等价地,“ A x = b Ax=b Ax=b是否相容?”.一个更困难的问题是要确定方程 A x = b Ax=b Ax=b对任意的 b b b是否有解.

例2 A = [ 1 3 4 − 4 2 − 6 − 3 − 2 − 7 ] , b = [ b 1 b 2 b 3 ] A=\begin{bmatrix} 1&3&4 \\ -4&2&-6 \\ -3&-2&-7 \end{bmatrix},b=\begin{bmatrix} b_1 \\ b_2 \\ b_3 \end{bmatrix} A= 143322467 ,b= b1b2b3 .方程 A x = b Ax=b Ax=b是否对一切可能 b 1 , b 2 , b 3 b_1,b_2,b_3 b1,b2,b3有解?

A x = b Ax=b Ax=b的增广矩阵进行行化简:
[ 1 3 4 b 1 − 4 2 − 6 b 2 − 3 − 2 − 7 b 3 ] ∽ [ 1 3 4 b 1 0 14 10 4 b 1 + b 2 0 7 5 3 b 1 + b 3 ] ∽ [ 1 3 4 b 1 0 14 10 4 b 1 + b 2 0 0 0 b 1 + b 3 − 1 2 b 2 ] \begin{bmatrix} 1&3&4&b_1 \\ -4&2&-6&b_2 \\ -3&-2&-7&b_3 \end{bmatrix} \backsim \begin{bmatrix} 1&3&4&b_1 \\ 0&14&10&4b_1+b_2 \\ 0&7&5&3b_1+b_3 \end{bmatrix} \backsim \begin{bmatrix} 1&3&4&b_1 \\ 0&14&10&4b_1+b_2 \\ 0&0&0&b_1+b_3-\frac{1}{2}b_2 \end{bmatrix} 143322467b1b2b3 10031474105b14b1+b23b1+b3 10031404100b14b1+b2b1+b321b2
第4列的第3个元素为 b 1 + b 3 − 1 2 b 2 b_1+b_3-\frac{1}{2}b_2 b1+b321b2.方程 A x = b Ax=b Ax=b并不是对一切的 b b b都相容,因为 b 1 + b 3 − 1 2 b 2 b_1+b_3-\frac{1}{2}b_2 b1+b321b2可能不为零.

  例2中的简化矩阵描述了使方程 A x = b Ax=b Ax=b相容的所有 b b b的集合: b b b必须满足
b 1 − 1 2 b 2 + b 3 = 0 b_1-\frac{1}{2}b_2+b_3=0 b121b2+b3=0
这是 R 3 \mathbb{R}^3 R3中一个通过原点的平面,这个平面就是 A A A的3列所有线性组合的集合.

  例2中的方程 A x = b Ax=b Ax=b并非对所有的 b b b都相容,这是因为 A A A的阶梯形含有零行.假如A在所有三行都有主元素,就不必注意增广列的计算,因为这时增广矩阵的阶梯形不可能产生如 [ 0 0 0 1 ] \begin{bmatrix} 0&0&0&1 \end{bmatrix} [0001]的行.
  称“A的列生成 R m \mathbb{R}^m Rm”时,意思是说 R m \mathbb{R}^m Rm中的每个向量 b b b都是 A A A的列的线性组合.一般地, R m \mathbb{R}^m Rm中向量集 S p a n { v 1 , ⋯   , v p } Span\lbrace v_1,\cdots ,v_p\rbrace Span{v1,,vp}生成 R m \mathbb{R}^m Rm的意思是, R m \mathbb{R}^m Rm中的每个向量都是 v 1 , ⋯   , v p v_1,\cdots ,v_p v1,,vp的线性组合,即 S p a n { v 1 , ⋯   , v p } = R m Span \lbrace v_1,\cdots ,v_p\rbrace = \mathbb{R}^m Span{v1,,vp}=Rm.

定理4 A A A m × n m\times n m×n矩阵,则下列命题是逻辑上等价的.也就是说,对某个 A A A,它们都成立或者都不成立.
a.对 R m \mathbb{R}^m Rm中每个 b b b,方程 A x = b Ax=b Ax=b有解.
b. R m \mathbb{R}^m Rm中的每个 b b b都是 A A A的列的一个线性组合.
c. A A A的各列生成 R m \mathbb{R}^m Rm.
d. A A A在每一行都有一个主元位置.

  命题(a)、(b)和(c)等价是根据 A x Ax Ax的定义和一组向量生成 R m \mathbb{R}^m Rm空间的含义而得到的.再根据例2的讨论得到命题(a)和(d)等价.

A x Ax Ax的计算

例3 计算 A x Ax Ax,其中 A = [ 2 3 4 − 1 5 − 3 6 − 2 8 ] , x = [ x 1 x 2 x 3 ] A=\begin{bmatrix} 2&3&4 \\ -1&5&-3 \\ 6&-2&8 \end{bmatrix},x=\begin{bmatrix} x_1 \\ x_2 \\ x_3 \end{bmatrix} A= 216352438 ,x= x1x2x3

[ 2 3 4 − 1 5 − 3 6 − 2 8 ] [ x 1 x 2 x 3 ] = x 1 [ 2 − 1 6 ] + x 2 [ 3 5 − 2 ] + x 3 [ 4 − 3 8 ] \begin{bmatrix} 2&3&4 \\ -1&5&-3 \\ 6&-2&8 \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \\ x_3 \end{bmatrix} = x_1 \begin{bmatrix} 2 \\ -1 \\ 6 \end{bmatrix} + x_2 \begin{bmatrix} 3 \\ 5 \\ -2 \end{bmatrix} + x_3 \begin{bmatrix} 4 \\ -3 \\ 8 \end{bmatrix} 216352438 x1x2x3 =x1 216 +x2 352 +x3 438

= [ 2 x 1 + 3 x 2 + 4 x 3 − x 1 + 5 x 2 − 3 x 3 6 x 1 − 2 x 2 + 8 x 3 ] (7) =\begin{bmatrix} 2x_1+3x_2+4x_3 \\ -x_1+5x_2-3x_3 \\ 6x_1-2x_2+8x_3 \end{bmatrix} \tag{7} = 2x1+3x2+4x3x1+5x23x36x12x2+8x3 (7)
矩阵 A x Ax Ax的第一个元素是 A A A的第一行与 x x x中相应元素乘机之和(有时称为点积),即
[ 2 3 4 ] [ x 1 x 2 x 3 ] = [ 2 x 1 + 3 x 2 + 4 x 3 ] \begin{bmatrix} 2&3&4 \\ \\ \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \\ x_3 \end{bmatrix} = \begin{bmatrix} 2x_1+3x_2+4x_3 \\ \\ \end{bmatrix} [234] x1x2x3 =[2x1+3x2+4x3]
此矩阵说明如何计算 A x Ax Ax中的第一个元素,而不必像(7)那样写出所有运算步骤.

计算 A x Ax Ax的行-向量规则
若乘积 A x Ax Ax有定义,则 A x Ax Ax中的第 i i i个元素是 A A A的第 i i i行元素与 x x x的相应元素乘积之和.

例4
a . [ 1 2 − 1 0 − 5 3 ] [ 4 3 7 ] = [ 1 ⋅ 4 + 2 ⋅ 3 + ( − 1 ) ⋅ 7 0 ⋅ 4 + ( − 5 ) ⋅ 3 + 3 ⋅ 7 ] = [ 3 6 ] a. \begin{bmatrix} 1&2&-1 \\ 0&-5&3 \end{bmatrix} \begin{bmatrix} 4 \\ 3 \\ 7 \\ \end{bmatrix} = \begin{bmatrix} 1\cdot 4+2\cdot 3+(-1)\cdot 7 \\ 0\cdot 4+(-5)\cdot 3+3\cdot 7 \end{bmatrix} = \begin{bmatrix} 3 \\ 6 \end{bmatrix} a.[102513] 437 =[14+23+(1)704+(5)3+37]=[36]

b . [ 2 − 3 8 0 − 5 2 ] [ 4 7 ] = [ 2 ⋅ 4 + ( − 3 ) ⋅ 7 8 ⋅ 4 + 0 ⋅ 7 ( − 5 ) ⋅ 4 + 2 ⋅ 7 ] = [ − 13 32 − 6 ] b. \begin{bmatrix} 2&-3 \\ 8&0 \\ -5&2 \end{bmatrix} \begin{bmatrix} 4 \\ 7 \\ \end{bmatrix} = \begin{bmatrix} 2\cdot 4+(-3)\cdot 7 \\ 8\cdot 4+0\cdot 7 \\ (-5)\cdot 4+2\cdot 7 \end{bmatrix} = \begin{bmatrix} -13 \\ 32 \\ -6 \end{bmatrix} b. 285302 [47]= 24+(3)784+07(5)4+27 = 13326

c . [ 1 0 0 0 1 0 0 0 1 ] [ r s t ] = [ 1 ⋅ r + 0 ⋅ s + 0 ⋅ t 0 ⋅ r + 1 ⋅ s + 0 ⋅ t 0 ⋅ r + 0 ⋅ s + 1 ⋅ t ] = [ r s t ] c. \begin{bmatrix} 1&0&0 \\ 0&1&0 \\ 0&0&1 \end{bmatrix} \begin{bmatrix} r \\ s \\ t \\ \end{bmatrix} = \begin{bmatrix} 1\cdot r+0\cdot s+0\cdot t \\ 0\cdot r+1\cdot s+0\cdot t \\ 0\cdot r+0\cdot s+1\cdot t \end{bmatrix} = \begin{bmatrix} r \\ s \\ t \\ \end{bmatrix} c. 100010001 rst = 1r+0s+0t0r+1s+0t0r+0s+1t = rst

  由定义,例4(c)中的矩阵的主对角线上元素为1,其它位置上元素为0,这个矩阵称为单位矩阵,并记为 I I I.(c)中的计算说明,对任意 R 3 \mathbb{R}^3 R3中的 x x x I x = x Ix=x Ix=x.类似地,有 n × n n\times n n×n单位矩阵,有时记为 I n I_n In,如(c)中所示,对任意 R n \mathbb{R}^n Rn中的 x x x I n x = x I_nx=x Inx=x.

矩阵-向量积 A x Ax Ax的性质

定理5 A A A m × n m\times n m×n矩阵, u u u v v v R n \mathbb{R}^n Rn中的向量, c c c是标量,则
a. A ( u + v ) = A u + A v A(u+v)=Au+Av A(u+v)=Au+Av.
b. A ( c u ) = c ( A u ) A(cu)=c(Au) A(cu)=c(Au).

  为简单起见,取 n = 3 n=3 n=3 A = [ a 1 a 2 a 3 ] A=\begin{bmatrix} a_1&a_2&a_3 \end{bmatrix} A=[a1a2a3] u , v u,v u,v R 3 \mathbb{R}^3 R3中的向量.对 i = 1 , 2 , 3 i=1,2,3 i=1,2,3,设 u i u_i ui v i v_i vi分别为 u u u v v v的第 i i i个元素.为证明(a),把 A ( u + v ) A(u+v) A(u+v)作为 A A A的各列以 u + v u+v u+v的各元素为权的线性组合来计算.
A ( u + v ) = [ a 1 a 2 a 3 ] [ u 1 + v 1 u 2 + v 2 u 3 + v 3 ] = ( u 1 + v 1 ) a 1 + ( u 2 + v 2 ) a 2 + ( u 3 + v 3 ) a 3 A(u+v)= \begin{bmatrix} a_1&a_2&a_3 \end{bmatrix} \begin{bmatrix} u_1+v_1 \\ u_2+v_2 \\ u_3+v_3 \end{bmatrix}= (u_1+v_1)a_1 + (u_2+v_2)a_2 + (u_3+v_3)a_3 A(u+v)=[a1a2a3] u1+v1u2+v2u3+v3 =(u1+v1)a1+(u2+v2)a2+(u3+v3)a3

= ( u 1 a 1 + u 2 a 2 + u 3 a 3 ) + ( v 1 a 1 + v 2 a 2 + v 3 a 3 ) = A u + A v = (u_1a_1+u_2a_2+u_3a_3) + (v_1a_1+v_2a_2+v_3a_3) = Au+Av =(u1a1+u2a2+u3a3)+(v1a1+v2a2+v3a3)=Au+Av

为证明(b),把 A ( c u ) A(cu) A(cu)作为A的各列以 c u cu cu的各元素为权的线性组合来计算.

A ( c u ) = [ a 1 a 2 a 3 ] [ c u 1 c u 2 c u 3 ] = ( c u 1 ) a 1 + ( c u 2 ) a 2 + ( c u 3 ) a 3 A(cu) = \begin{bmatrix} a_1&a_2&a_3 \end{bmatrix} \begin{bmatrix} cu_1 \\ cu_2 \\ cu_3 \end{bmatrix} = (cu_1)a_1 + (cu_2)a_2 + (cu_3)a_3 A(cu)=[a1a2a3] cu1cu2cu3 =(cu1)a1+(cu2)a2+(cu3)a3

= c ( u 1 a 1 ) + c ( u 2 a 2 ) + c ( u 3 a 3 ) = c ( u 1 a 1 + u 2 a 2 + u 3 a 3 ) = c ( A u ) = c(u_1a_1) + c(u_2a_2) + c(u_3a_3) = c(u_1a_1 + u_2a_2 + u_3a_3) = c(Au) =c(u1a1)+c(u2a2)+c(u3a3)=c(u1a1+u2a2+u3a3)=c(Au)

定理4的证明   如定理4后面所指出的,命题(a)、(b)和(c)逻辑上等价.因此,只需证明命题(a)和(d)同时为真,或同时为假,就可以建立四个命题的等价性.
  设 U U U A A A的阶梯形.给定 R m \mathbb{R}^m Rm中的 b b b,可以把增广矩阵 [ A b ] \begin{bmatrix} A&b \end{bmatrix} [Ab]行化简为增广矩阵 [ U d ] \begin{bmatrix} U&d \end{bmatrix} [Ud] d d d R m \mathbb{R}^m Rm中的某个向量.

[ A b ] ∽ ⋯ ∽ [ U d ] \begin{bmatrix} A&b \end{bmatrix} \backsim \cdots \backsim \begin{bmatrix} U&d \end{bmatrix} [Ab][Ud]

  若(d)成立,则 U U U的每一行包含一个主元位置而在增广列中不可能有主元.故对任意 b b b A x = b Ax=b Ax=b有解,(a)成立.若(d)不成立,则 U U U的最后一行都是0.设 d d d是最后一个元素为1的向量,于是 [ U d ] \begin{bmatrix} U&d \end{bmatrix} [Ud]代表一个不相容的方程组.因行变换是可逆的,故 [ U d ] \begin{bmatrix} U&d \end{bmatrix} [Ud]可变换为形如 [ A b ] \begin{bmatrix} A&b \end{bmatrix} [Ab]的矩阵,所得方程组 A x = b Ax=b Ax=b也是不相容的,(a)也不成立.

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值