一、向量与矩阵
下面是三个向量 u \boldsymbol u u、 v \boldsymbol v v、 w \boldsymbol w w: u = [ 1 − 1 0 ] v = [ 0 1 − 1 ] w = [ 0 0 1 ] \boldsymbol u=\begin{bmatrix}\,\,\,\,1\\-1\\\,\,\,\,0\end{bmatrix}\kern 10pt\boldsymbol v=\begin{bmatrix}\,\,\,\,0\\\,\,\,\,1\\-1\end{bmatrix}\kern 10pt\boldsymbol w=\begin{bmatrix}0\\0\\1\end{bmatrix} u= 1−10 v= 01−1 w= 001 它们在三维空间中的线性组合是 x 1 u + x 2 v + x 3 w x_1\boldsymbol u+x_2\boldsymbol v+x_3\boldsymbol w x1u+x2v+x3w: 向量的线性组合 : x 1 [ 1 − 1 0 ] + x 2 [ 0 1 − 1 ] + x 3 [ 0 0 1 ] = [ x 1 x 2 − x 1 x 3 − x 2 ] ( 1.3.1 ) \textbf{向量的线性组合}:\kern 5ptx_1\begin{bmatrix}\,\,\,\,1\\-1\\\,\,\,\,0\end{bmatrix}+x_2\begin{bmatrix}\,\,\,\,0\\\,\,\,\,1\\-1\end{bmatrix}+x_3\begin{bmatrix}0\\0\\1\end{bmatrix}=\begin{bmatrix}x_1\kern 23pt\\x_2-x_1\\x_3-x_2\end{bmatrix}\kern 12pt(1.3.1) 向量的线性组合:x1 1−10 +x2 01−1 +x3 001 = x1x2−x1x3−x2 (1.3.1)现在利用矩阵改写式(1.3.1), u \boldsymbol u u、 v \boldsymbol v v、 w \boldsymbol w w 变成矩阵 A A A 的列,得到一个矩阵 A A A 乘向量 ( x 1 , x 2 , x 3 ) (x_1,x_2,x_3) (x1,x2,x3):
矩阵乘向量,列的组合 : A x = [ 1 0 0 − 1 1 0 0 − 1 1 ] [ x 1 x 2 x 3 ] = [ x 1 x 2 − x 1 x 3 − x 2 ] ( 1.3.2 ) \textbf{矩阵乘向量,列的组合}:\kern 5ptA\boldsymbol x=\begin{bmatrix}\,\,\,\,1&\,\,\,\,0&0\\-1&\kern 7pt1&0\\\,\,\,\,0&-1&1\end{bmatrix}\begin{bmatrix}x_1\\x_2\\x_3\end{bmatrix}=\begin{bmatrix}x_1\kern 23pt\\x_2-x_1\\x_3-x_2\end{bmatrix}\kern 20pt(1.3.2) 矩阵乘向量,列的组合:Ax= 1−1001−1001 x1x2x3 = x1x2−x1x3−x2 (1.3.2)
x
1
x_1
x1、
x
2
x_2
x2、
x
3
x_3
x3 是向量
x
\boldsymbol x
x 的分量,矩阵
A
A
A 乘向量
x
\boldsymbol x
x 与式(1.3.1)三个列的线性组合等价。
这里的改写可以让我们从不同的视角来观察,一开始是三个数字
x
1
x_1
x1,
x
2
x_2
x2,
x
3
x_3
x3 乘向量,现在是矩阵乘这三个数字。矩阵
A
A
A 作用于向量
x
\boldsymbol x
x,输出的
A
x
A\boldsymbol x
Ax 是矩阵
A
\pmb A
A 列的组合
b
\boldsymbol b
b。
为方便观察,将
A
x
A\boldsymbol x
Ax 的分量记为
b
1
b_1
b1,
b
2
b_2
b2,
b
3
b_3
b3:
A
x
=
[
1
0
0
−
1
1
0
0
−
1
1
]
[
x
1
x
2
x
3
]
=
[
x
1
x
2
−
x
1
x
3
−
x
2
]
=
[
b
1
b
2
b
3
]
=
b
(
1.3.3
)
A\boldsymbol x=\begin{bmatrix}\kern 7pt1&\kern 7pt0&0\\-1&\kern 7pt1&0\\\kern 7pt0&-1&1\end{bmatrix}\begin{bmatrix}x_1\\x_2\\x_3\end{bmatrix}=\begin{bmatrix}x_1\kern 23pt\\x_2-x_1\\x_3-x_2\end{bmatrix}=\begin{bmatrix}b_1\\b_2\\b_3\end{bmatrix}=\boldsymbol b\kern 20pt(1.3.3)
Ax=
1−1001−1001
x1x2x3
=
x1x2−x1x3−x2
=
b1b2b3
=b(1.3.3)输入是
x
\boldsymbol x
x,输出是
b
=
A
x
\boldsymbol b=A\boldsymbol x
b=Ax。这里
A
A
A 是一个差分矩阵(difference matrix),因为
b
\boldsymbol b
b 包含了输入
x
\boldsymbol x
x 的差。最上面的差是
x
1
−
x
0
=
x
1
−
0
x_1-x_0=x_1-0
x1−x0=x1−0。
当
x
=
(
1
,
4
,
9
)
\boldsymbol x=(1,4,9)
x=(1,4,9) 时:
x
\boldsymbol x
x 中是平方数,
b
\boldsymbol b
b 中是奇数:
x
=
[
1
4
9
]
=
平方数
A
x
=
[
1
−
0
4
−
1
9
−
4
]
=
[
1
3
5
]
=
b
(
1.3.4
)
\boldsymbol x=\begin{bmatrix}1\\4\\9\end{bmatrix}=平方数\kern 10ptA\boldsymbol x=\begin{bmatrix}1-0\\4-1\\9-4\end{bmatrix}=\begin{bmatrix}1\\3\\5\end{bmatrix}=\boldsymbol b\kern 20pt(1.3.4)
x=
149
=平方数Ax=
1−04−19−4
=
135
=b(1.3.4)这里可以扩展到
4
×
4
4\times4
4×4 的矩阵,下一个平方数
x
4
=
16
x_4=16
x4=16,下一个差是
x
4
−
x
3
=
16
−
9
=
7
x_4-x_3=16-9=7
x4−x3=16−9=7(下个奇数)。这个矩阵可以一次性将所有的差
1
1
1、
3
3
3、
5
5
5、
7
7
7 都计算出来。
重要注解: 每次乘一行。矩阵与向量的乘法,可以用另一种方式来解释,即使用行而不是列。
A
x
A\boldsymbol x
Ax 也是行的点积:
矩阵乘向量,行的点积 : A x = [ 1 0 0 − 1 1 0 0 − 1 1 ] [ x 1 x 2 x 3 ] = [ ( 1 , 0 , 0 ) ⋅ ( x 1 , x 2 , x 3 ) ( − 1 , 1 , 0 ) ⋅ ( x 1 , x 2 , x 3 ) ( 0 , − 1 , 1 ) ⋅ ( x 1 , x 2 , x 3 ) ] ( 1.3.5 ) \textbf{矩阵乘向量,行的点积}:A\boldsymbol x=\begin{bmatrix}\kern 7pt1&\kern 7pt0&0\\-1&\kern 7pt1&0\\\kern 7pt0&-1&1\end{bmatrix}\begin{bmatrix}x_1\\x_2\\x_3\end{bmatrix}=\begin{bmatrix}\kern 7pt(1,0,0)\cdot(x_1,x_2,x_3)\\(-1,1,0)\cdot(x_1,x_2,x_3)\\(0,-1,1)\cdot(x_1,x_2,x_3)\end{bmatrix}\kern 15pt(1.3.5) 矩阵乘向量,行的点积:Ax= 1−1001−1001 x1x2x3 = (1,0,0)⋅(x1,x2,x3)(−1,1,0)⋅(x1,x2,x3)(0,−1,1)⋅(x1,x2,x3) (1.3.5)
二、线性方程组
以前的问题是数字
x
1
x_1
x1、
x
2
x_2
x2、
x
3
x_3
x3 已知,求
b
\boldsymbol b
b;现在的问题是
b
\boldsymbol b
b 已知,求出
x
\boldsymbol x
x。
老问题:计算线性组合
x
1
u
+
x
2
v
+
x
3
w
x_1\boldsymbol u+x_2\boldsymbol v+x_3\boldsymbol w
x1u+x2v+x3w 求出
b
\boldsymbol b
b。
新问题:
u
\boldsymbol u
u、
v
\boldsymbol v
v、
w
\boldsymbol w
w 什么样的线性组合可以得到特定的向量
b
\boldsymbol b
b ?
这两个问题是相反的。新问题是求解输入
x
\boldsymbol x
x 以便得到输出
b
=
A
x
\boldsymbol b=A\boldsymbol x
b=Ax。这是
x
1
x_1
x1、
x
2
x_2
x2、
x
3
x_3
x3 的线性方程组,方程右侧是
b
1
b_1
b1、
b
2
b_2
b2、
b
3
b_3
b3,现在要求解
A
x
=
b
A\boldsymbol x=\boldsymbol b
Ax=b 找到
x
1
x_1
x1,
x
2
x_2
x2,
x
3
x_3
x3:
方程 A x = b x 1 = b 1 − x 1 + x 2 = b 2 − x 2 + x 3 = b 3 解 x = A − 1 b x 1 = b 1 x 2 = b 1 + b 2 x 3 = b 1 + b 2 + b 3 ( 1.3.6 ) 方程\,A\boldsymbol x=\boldsymbol b\kern 10pt\begin{matrix}\kern 7ptx_1\kern 3pt\kern 20pt=b_1\\-x_1+x_2=b_2\\-x_2+x_3=b_3\end{matrix}\kern 10pt解\,\boldsymbol x=A^{-1}\boldsymbol b\kern 10pt\begin{matrix}x_1=b_1\kern 43pt\\x_2=b_1+b_2\kern 21pt\\x_3=b_1+b_2+b_3\end{matrix}\kern 12pt(1.3.6) 方程Ax=bx1=b1−x1+x2=b2−x2+x3=b3解x=A−1bx1=b1x2=b1+b2x3=b1+b2+b3(1.3.6)
大部分线性系统并不容易求解。但是该例中,第一个方程求出
x
1
=
b
1
x_1=b_1
x1=b1,第二个方程求出
x
2
=
b
1
+
b
2
x_2=b_1+b_2
x2=b1+b2,第三个方程求出
x
3
=
b
1
+
b
2
+
b
3
x_3=b_1+b_2+b_3
x3=b1+b2+b3。因为
A
A
A 是三角矩阵,这些方程可以有序的求出解(从顶部到底部)。
下面是两个具体的例子:
b
=
[
0
0
0
]
得
x
=
[
0
0
0
]
,
b
=
[
1
3
5
]
得
x
=
[
1
1
+
3
1
+
3
+
5
]
=
[
1
4
9
]
\boldsymbol b=\begin{bmatrix}0\\0\\0\end{bmatrix}得\,\boldsymbol x=\begin{bmatrix}0\\0\\0\end{bmatrix},\kern 5pt\boldsymbol b=\begin{bmatrix}1\\3\\5\end{bmatrix}得\,\boldsymbol x=\begin{bmatrix}1\kern 36pt\\1+3\kern 18pt\\1+3+5\end{bmatrix}=\begin{bmatrix}1\\4\\9\end{bmatrix}
b=
000
得x=
000
,b=
135
得x=
11+31+3+5
=
149
第一个解全都是
0
0
0 的例子是很重要。用语言来描述就是:如果输出
b
=
0
\boldsymbol b=\boldsymbol 0
b=0,则必有输入
x
=
0
\boldsymbol x=\boldsymbol 0
x=0。对于这个矩阵
A
A
A 是成立的,但并不是对所有的矩阵都成立。
矩阵
A
A
A 是可逆的,从
b
\boldsymbol b
b 可以反推得到
x
\boldsymbol x
x,记作
x
=
A
−
1
b
\boldsymbol x=A^{-1}\boldsymbol b
x=A−1b。
三、逆矩阵
式(1.3.6)中的
A
−
1
A^{-1}
A−1 是一个求和矩阵:
求解
A
x
=
b
[
x
1
x
2
x
3
]
=
[
b
1
b
1
+
b
2
b
1
+
b
2
+
b
3
]
=
[
1
0
0
1
1
0
1
1
1
]
[
b
1
b
2
b
3
]
(
1.3.7
)
求解\,A\boldsymbol x=\boldsymbol b\kern 10pt\begin{bmatrix}x_1\\x_2\\x_3\end{bmatrix}=\begin{bmatrix}b_1\kern 43pt\\b_1+b_2\kern 22pt\\b_1+b_2+b_3\end{bmatrix}=\begin{bmatrix}1&0&0\\1&1&0\\1&1&1\end{bmatrix}\begin{bmatrix}b_1\\b_2\\b_3\end{bmatrix}\kern 15pt(1.3.7)
求解Ax=b
x1x2x3
=
b1b1+b2b1+b2+b3
=
111011001
b1b2b3
(1.3.7)如果
x
\boldsymbol x
x 之间的差是
b
\boldsymbol b
b,那么
b
\boldsymbol b
b 之间的和就是
x
\boldsymbol x
x。方程式(1.3.7)的求和矩阵就是差分矩阵
A
A
A 的逆矩阵
A
−
1
A^{-1}
A−1。
例:
x
=
(
1
,
2
,
3
)
\boldsymbol x=(1,2,3)
x=(1,2,3) 的差是
b
=
(
1
,
1
,
1
)
\boldsymbol b=(1,1,1)
b=(1,1,1),所以
b
=
A
x
\boldsymbol b=A\boldsymbol x
b=Ax,
x
=
A
−
1
b
\boldsymbol x=A^{-1}\boldsymbol b
x=A−1b:
A
x
=
[
1
0
0
−
1
1
0
0
−
1
1
]
[
1
2
3
]
=
[
1
1
1
]
A
−
1
b
=
[
1
0
0
1
1
0
1
1
1
]
[
1
1
1
]
=
[
1
2
3
]
A\boldsymbol x=\begin{bmatrix}\kern 7pt1&\kern 7pt0&0\\-1&\kern 7pt1&0\\\kern 7pt0&-1&1\end{bmatrix}\begin{bmatrix}1\\2\\3\end{bmatrix}=\begin{bmatrix}1\\1\\1\end{bmatrix}\kern 10ptA^{-1}\boldsymbol b=\begin{bmatrix}1&0&0\\1&1&0\\1&1&1\end{bmatrix}\begin{bmatrix}1\\1\\1\end{bmatrix}=\begin{bmatrix}1\\2\\3\end{bmatrix}
Ax=
1−1001−1001
123
=
111
A−1b=
111011001
111
=
123
从方程(1.3.7)的解
x
=
(
x
1
,
x
2
,
x
3
)
\boldsymbol x=(x_1,x_2,x_3)
x=(x1,x2,x3) 可以得到两个结论:
- 对于每一个 b \boldsymbol b b,都存在一个 A x = b A\boldsymbol x=\boldsymbol b Ax=b 的解;
- 矩阵 A − 1 A^{-1} A−1 可以得到解 x = A − 1 b \boldsymbol x=A^{-1}\boldsymbol b x=A−1b。
微积分注解:将这些特殊的矩阵同微积分联系起来,向量
x
\boldsymbol x
x 对应函数
x
(
t
)
x(t)
x(t),差分
A
x
A\boldsymbol x
Ax 对应导数
d
x
/
d
t
=
b
(
t
)
\textrm dx/\textrm dt=b(t)
dx/dt=b(t),和
A
−
1
b
A^{-1}\boldsymbol b
A−1b 就对应
b
(
t
)
b(t)
b(t) 的积分。差的和就像导数的积分。
从微积分的基础定理我们知道:导数和积分互为逆运算。
A
x
=
b
与
x
=
A
−
1
b
d
x
d
t
=
b
(
t
)
与
x
(
t
)
=
∫
0
t
b
(
t
)
d
t
(
1.3.8
)
A\boldsymbol x=\boldsymbol b\,与\,\boldsymbol x=A^{-1}\boldsymbol b\kern 15pt\frac{\textrm dx}{\textrm dt}=b(t)\,与\,x(t)=\int_0^tb(t)\,\textrm dt\kern 15pt(1.3.8)
Ax=b与x=A−1bdtdx=b(t)与x(t)=∫0tb(t)dt(1.3.8)平方数
0
0
0,
1
1
1,
4
4
4,
9
9
9 的差分是奇数
1
1
1,
3
3
3,
5
5
5,
7
7
7,
x
(
t
)
=
t
2
x(t)=t^2
x(t)=t2 的导数是
2
t
2t
2t,当
t
=
1
,
2
,
3
t=1,2,3
t=1,2,3 时得到偶数
b
=
2
,
4
,
6
b=2,4,6
b=2,4,6。但是差分和导数不同,这里矩阵
A
A
A 得到的不是
2
t
2t
2t,而是
2
t
−
1
2t-1
2t−1:反向差分(backward difference)
x
(
t
)
−
x
(
t
−
1
)
=
t
2
−
(
t
−
1
)
2
=
t
2
−
(
t
2
−
2
t
+
1
)
=
2
t
−
1
(
1.3.9
)
x(t)-x(t-1)=t^2-(t-1)^2=t^2-(t^2-2t+1)=2t-1\kern 10pt(1.3.9)
x(t)−x(t−1)=t2−(t−1)2=t2−(t2−2t+1)=2t−1(1.3.9)前向差分(forward difference)会得到
2
t
+
1
2t+1
2t+1。中心差分(centered difference)是
Δ
x
/
Δ
t
\Delta x/\Delta t
Δx/Δt,其中
Δ
x
=
x
(
t
+
1
)
−
x
(
t
−
1
)
\Delta x=x(t+1)-x(t-1)
Δx=x(t+1)−x(t−1),
Δ
t
=
(
t
+
1
)
−
(
t
−
1
)
=
2
\Delta t=(t+1)-(t-1)=2
Δt=(t+1)−(t−1)=2:
x
(
t
)
=
t
2
的中心差分
(
t
+
1
)
2
−
(
t
−
1
)
2
2
=
2
t
(
1.3.10
)
x(t)=t^2\,的中心差分\kern 15pt\frac{(t+1)^2-(t-1)^2}{2}=2t\kern 15pt(1.3.10)
x(t)=t2的中心差分2(t+1)2−(t−1)2=2t(1.3.10)
四、循环差分
循环差分(cyclic difference)是不可逆的,这里同上个例子有三个向量, u \boldsymbol u u 和 v \boldsymbol v v 不变,将 w \boldsymbol w w 改成 w ∗ \boldsymbol w^* w∗: u = [ 1 − 1 0 ] v = [ 0 1 − 1 ] w ∗ = [ − 1 0 1 ] \boldsymbol u=\begin{bmatrix}\kern 7pt1\\-1\\\kern 7pt0\end{bmatrix}\kern 5pt\boldsymbol v=\begin{bmatrix}\kern 7pt0\\\kern 7pt1\\-1\end{bmatrix}\kern 5pt\boldsymbol w^*=\begin{bmatrix}-1\\\kern 7pt0\\\kern 7pt1\end{bmatrix} u= 1−10 v= 01−1 w∗= −101 现在 u , v , w ∗ \boldsymbol u,\boldsymbol v,\boldsymbol w^* u,v,w∗ 的线性组合将得到循环差分矩阵 C C C:
循环差分 C x = [ 1 0 − 1 − 1 1 0 0 − 1 1 ] [ x 1 x 2 x 3 ] = [ x 1 − x 3 x 2 − x 1 x 3 − x 2 ] = b ( 1.3.11 ) \textbf{循环差分}\kern 15ptC\boldsymbol x=\begin{bmatrix}\kern 7pt1&\kern 7pt0&-1\\-1&\kern 7pt1&\kern 7pt0\\\kern 7pt0&-1&\kern 7pt1\end{bmatrix}\begin{bmatrix}x_1\\x_2\\x_3\end{bmatrix}=\begin{bmatrix}x_1-x_3\\x_2-x_1\\x_3-x_2\end{bmatrix}=\boldsymbol b\kern 15pt(1.3.11) 循环差分Cx= 1−1001−1−101 x1x2x3 = x1−x3x2−x1x3−x2 =b(1.3.11)
C
C
C 不是一个三角矩阵。当给定
b
\boldsymbol b
b 时,
C
x
=
b
C\boldsymbol x=\boldsymbol b
Cx=b 要么有无穷多个解,要么无解:
C
x
=
0
有无穷多个解
x
[
x
1
−
x
3
x
2
−
x
1
x
3
−
x
2
]
=
[
0
0
0
]
的解是所有向量
[
x
1
x
2
x
3
]
=
[
c
c
c
]
(
1.3.12
)
C\boldsymbol x=\boldsymbol 0\,有无穷多个解\,\boldsymbol x\kern 10pt\begin{bmatrix}x_1-x_3\\x_2-x_1\\x_3-x_2\end{bmatrix}=\begin{bmatrix}0\\0\\0\end{bmatrix} 的解是所有向量\begin{bmatrix}x_1\\x_2\\x_3\end{bmatrix}=\begin{bmatrix}c\\c\\c\end{bmatrix}\kern 10pt(1.3.12)
Cx=0有无穷多个解x
x1−x3x2−x1x3−x2
=
000
的解是所有向量
x1x2x3
=
ccc
(1.3.12)每一个常数
c
c
c 都满足,例如
x
=
(
3
,
3
,
3
)
\boldsymbol x=(3,3,3)
x=(3,3,3) 的循环差都是
0
0
0。任意常数
c
c
c 就像不定积分时所加的任意常数
+
C
+C
+C。
C
x
=
b
C\boldsymbol x=\boldsymbol b
Cx=b 更大的可能是
x
\boldsymbol x
x 无解:
C
x
=
b
[
x
1
−
x
3
x
2
−
x
1
x
3
−
x
2
]
=
[
1
3
5
]
左侧相加等于
0
右侧相加等于
9
x
1
,
x
2
,
x
3
无解
(
1.3.13
)
C\boldsymbol x=\boldsymbol b\kern 10pt\begin{bmatrix}x_1-x_3\\x_2-x_1\\x_3-x_2\end{bmatrix}=\begin{bmatrix}1\\3\\5\end{bmatrix}\kern 10pt\begin{matrix}左侧相加等于0\\右侧相加等于9\\x_1,x_2,x_3无解\end{matrix}\kern 10pt(1.3.13)
Cx=b
x1−x3x2−x1x3−x2
=
135
左侧相加等于0右侧相加等于9x1,x2,x3无解(1.3.13)从几何角度来看,不存在
u
,
v
,
w
∗
\boldsymbol u,\boldsymbol v,\boldsymbol w^*
u,v,w∗ 的线性组合可以得到向量
b
=
(
1
,
3
,
5
)
\boldsymbol b=(1,3,5)
b=(1,3,5),它们的线性组合无法形成全部的三维空间。右侧的向量必须满足
b
1
+
b
2
+
b
3
=
0
b_1+b_2+b_3=0
b1+b2+b3=0 才能保证
C
x
=
b
C\boldsymbol x=\boldsymbol b
Cx=b 有解,因为左侧的
(
x
1
−
x
3
)
+
(
x
2
−
x
1
)
+
(
x
3
−
x
2
)
=
0
(x_1-x_3)+(x_2-x_1)+(x_3-x_2)=0
(x1−x3)+(x2−x1)+(x3−x2)=0。换句话说:
所有的线性组合
x
1
u
+
x
2
v
+
x
3
w
∗
x_1\boldsymbol u+x_2\boldsymbol v+x_3\boldsymbol w^*
x1u+x2v+x3w∗ 落在平面
b
1
+
b
2
+
b
3
=
0
b_1+b_2+b_3=0
b1+b2+b3=0 上。
这里将代数与几何相结合,线性组合可以形成整个空间,也可以只形成一个平面。Figure1.10 展示了这两种情况之间的差别:
五、无关与相关
Figure1.10 中第一个图是矩阵
A
A
A 的列向量,第二个图是矩阵
C
C
C 的列向量。
u
\boldsymbol u
u 和
v
\boldsymbol v
v 是一样的,只看这两个向量的组合,可以得到一个二维的平面,关键是第三个向量是否在这个平面上。
无关(independence):
w
\boldsymbol w
w 不在
u
\boldsymbol u
u 和
v
\boldsymbol v
v 形成的平面上。
相关(dependence):
w
∗
\boldsymbol w^*
w∗ 在
u
\boldsymbol u
u 和
v
\boldsymbol v
v 形成的平面上。
重点在于向量
w
∗
\boldsymbol w^*
w∗ 是
u
\boldsymbol u
u 和
v
\boldsymbol v
v 的线性组合:
u
+
v
+
w
∗
=
0
w
∗
=
[
−
1
0
1
]
=
−
u
−
v
(
1.3.14
)
\boldsymbol u+\boldsymbol v+\boldsymbol w^*=\boldsymbol 0\kern 15pt\boldsymbol w^*=\begin{bmatrix}-1\\\kern 7pt0\\\kern 7pt1\end{bmatrix}=-\boldsymbol u-\boldsymbol v\kern 20pt(1.3.14)
u+v+w∗=0w∗=
−101
=−u−v(1.3.14)这三个向量
u
,
v
,
w
∗
\boldsymbol u,\boldsymbol v,\boldsymbol w^*
u,v,w∗ 分量的和都是零,它们所有的线性组合都会有
b
1
+
b
2
+
b
3
=
0
b_1+b_2+b_3=0
b1+b2+b3=0(即将这三个方程相加),这个平面就是
u
\boldsymbol u
u 和
v
\boldsymbol v
v 的线性组合所形成的,而
w
∗
\boldsymbol w^*
w∗ 已经在这个平面上了,我们并没有得到任何新的向量。
而
w
=
(
0
,
0
,
1
)
\boldsymbol w=(0,0,1)
w=(0,0,1) 并不在这个平面上,因为
0
+
0
+
1
≠
0
0+0+1\neq0
0+0+1=0,
u
,
v
,
w
\boldsymbol u,\boldsymbol v,\boldsymbol w
u,v,w 的线性组合可以形成整个三维空间。对于任意的
b
\boldsymbol b
b,我们可以通过式(1.3.6)
x
=
A
−
1
b
\boldsymbol x=A^{-1}\boldsymbol b
x=A−1b 找到它的线性组合,使方程成立。
u
,
v
,
w
\boldsymbol u,\boldsymbol v,\boldsymbol w
u,v,w 无关,除了
0
u
+
0
v
+
0
w
=
0
0\boldsymbol u+0\boldsymbol v+0\boldsymbol w=\boldsymbol 0
0u+0v+0w=0 外,没有其它任何线性组合可以得到
b
=
0
\boldsymbol b=\boldsymbol 0
b=0。
u
,
v
,
w
∗
\boldsymbol u,\boldsymbol v,\boldsymbol w^*
u,v,w∗ 相关,存在除
x
=
(
0
,
0
,
0
)
\boldsymbol x=(0,0,0)
x=(0,0,0) 之外的其它线性组合使得
A
x
=
b
=
0
A\boldsymbol x=\boldsymbol b=\boldsymbol 0
Ax=b=0。
将其推广到
n
n
n 维空间的
n
n
n 个向量,则这些向量是一个
n
×
n
n\times n
n×n 矩阵的列:
无关列:
A
x
=
0
A\boldsymbol x=\boldsymbol 0
Ax=0 仅有一个解,
A
A
A 是可逆矩阵。
相关列:
C
x
=
0
C\boldsymbol x=\boldsymbol 0
Cx=0 有很多解,
C
C
C 是奇异矩阵。
六、主要内容总结
- 矩阵乘向量: A x = A A\boldsymbol x=A Ax=A 列的线性组合。
- 当 A A A 是可逆矩阵时, A x = b A\boldsymbol x=\boldsymbol b Ax=b 的解是 x = A − 1 b \boldsymbol x=A^{-1}\boldsymbol b x=A−1b。
- 循环差分矩阵 C C C 没有逆矩阵,因为它的三个列在同一平面,这些相关列相加是零向量, C x = 0 C\boldsymbol x=\boldsymbol 0 Cx=0 有很多解。
七、例题
【例1】 将
A
A
A 的左下角单元
a
31
a_{31}
a31(第3行,1列)改成
a
31
=
1
a_{31}=1
a31=1,则
A
x
=
b
A\boldsymbol x=\boldsymbol b
Ax=b 变成:
[
1
0
0
−
1
1
0
1
−
1
1
]
[
x
1
x
2
x
3
]
=
[
x
1
−
x
1
+
x
2
x
1
−
x
2
+
x
3
]
=
[
b
1
b
2
b
3
]
\begin{bmatrix}\kern 7pt1&\kern 7pt0&0\\-1&\kern 7pt1&0\\\kern 7pt1&-1&1\end{bmatrix}\begin{bmatrix}x_1\\x_2\\x_3\end{bmatrix}=\begin{bmatrix}x_1\kern 47pt\\-x_1+x_2\kern 31pt\\x_1-x_2+x_3\end{bmatrix}=\begin{bmatrix}b_1\\b_2\\b_3\end{bmatrix}
1−1101−1001
x1x2x3
=
x1−x1+x2x1−x2+x3
=
b1b2b3
对任意的
b
\boldsymbol b
b 求出
x
\boldsymbol x
x。求出
A
A
A 的逆矩阵
A
−
1
A^{-1}
A−1,使得
x
=
A
−
1
b
\boldsymbol x=A^{-1}\boldsymbol b
x=A−1b 成立。
解: 从上到下求解(线性三角形)系统
A
x
=
b
A\boldsymbol x=\boldsymbol b
Ax=b:
{
x
1
=
b
1
x
2
=
b
1
+
b
2
x
3
=
b
2
+
b
3
可得
x
=
A
−
1
b
=
[
1
0
0
1
1
0
0
1
1
]
[
b
1
b
2
b
3
]
\left\{\begin{matrix}x_1=b_1\kern 44pt\\x_2=b_1+b_2\kern 22pt\\x_3=\kern 21ptb_2+b_3\end{matrix}\right.可得\,\boldsymbol x=A^{-1}\boldsymbol b=\begin{bmatrix}1&0&0\\1&1&0\\0&1&1\end{bmatrix}\begin{bmatrix}b_1\\b_2\\b_3\end{bmatrix}
⎩
⎨
⎧x1=b1x2=b1+b2x3=b2+b3可得x=A−1b=
110011001
b1b2b3
矩阵
A
A
A 的三个列仍是无关列,它们不在同一平面,这三个列的线性组合使用正确的加权
x
1
x_1
x1,
x
2
x_2
x2,
x
3
x_3
x3,可以得到任意的三维向量
b
=
(
b
1
,
b
2
,
b
3
)
\boldsymbol b=(b_1,b_2,b_3)
b=(b1,b2,b3),而这些加权可以从
x
=
A
−
1
b
\boldsymbol x=A^{-1}\boldsymbol b
x=A−1b 得到。
【例2】
E
E
E 是一个消元(elimination)矩阵,
E
E
E 有一个减法,
E
−
1
E^{-1}
E−1 则有一个加法。
b
=
E
x
[
b
1
b
2
]
=
[
x
1
x
2
−
l
x
1
]
=
[
1
0
−
l
1
]
[
x
1
x
2
]
E
=
[
1
0
−
l
1
]
\boldsymbol b=E\boldsymbol x\kern 15pt\begin{bmatrix}b_1\\b_2\end{bmatrix}=\begin{bmatrix}x_1\kern 27pt\\x_2-lx_1\end{bmatrix}=\begin{bmatrix}\kern 7pt1&0\\-l&1\end{bmatrix}\begin{bmatrix}x_1\\x_2\end{bmatrix}\kern 15ptE=\begin{bmatrix}\kern 7pt1&0\\-l&1\end{bmatrix}
b=Ex[b1b2]=[x1x2−lx1]=[1−l01][x1x2]E=[1−l01]第一个方程是
x
1
=
b
1
x_1=b_1
x1=b1,第二个方程是
x
2
−
l
x
1
=
b
2
x_2-lx_1=b_2
x2−lx1=b2。因为消元矩阵有减法,所以其逆矩阵会把
l
b
1
lb_1
lb1 加到
b
2
b_2
b2:
x
=
E
−
1
b
[
x
1
x
2
]
=
[
b
1
l
b
1
+
b
2
]
=
[
1
0
l
1
]
[
b
1
b
2
]
E
−
1
=
[
1
0
l
1
]
\boldsymbol x=E^{-1}\boldsymbol b\kern 15pt\begin{bmatrix}x_1\\x_2\end{bmatrix}=\begin{bmatrix}b_1\kern 19pt\\lb_1+b_2\end{bmatrix}=\begin{bmatrix}1&0\\l&1\end{bmatrix}\begin{bmatrix}b_1\\b_2\end{bmatrix}\kern 15ptE^{-1}=\begin{bmatrix}1&0\\l&1\end{bmatrix}
x=E−1b[x1x2]=[b1lb1+b2]=[1l01][b1b2]E−1=[1l01]
【例3】将矩阵
C
C
C 从循环差分变为中心差分产生
x
3
−
x
1
x_3-x_1
x3−x1:
C
x
=
b
[
0
1
0
−
1
0
1
0
−
1
0
]
[
x
1
x
2
x
3
]
=
[
x
2
−
0
x
3
−
x
1
0
−
x
2
]
=
[
b
1
b
2
b
3
]
(
1.3.15
)
C\boldsymbol x=\boldsymbol b\kern 15pt\begin{bmatrix}\kern 7pt0&\kern 7pt1&0\\-1&\kern 7pt0&1\\\kern 7pt0&-1&0\end{bmatrix}\begin{bmatrix}x_1\\x_2\\x_3\end{bmatrix}=\begin{bmatrix}x_2-0\kern 6pt\\x_3-x_1\\0-x_2\end{bmatrix}=\begin{bmatrix}b_1\\b_2\\b_3\end{bmatrix}\kern 20pt(1.3.15)
Cx=b
0−1010−1010
x1x2x3
=
x2−0x3−x10−x2
=
b1b2b3
(1.3.15)
C
x
=
b
C\boldsymbol x=\boldsymbol b
Cx=b 只有在
b
1
+
b
3
=
x
2
−
x
2
=
0
b_1+b_3=x_2-x_2=0
b1+b3=x2−x2=0 时才有解,这个是三维空间中向量
b
\boldsymbol b
b 的一个平面。
C
C
C 的每一列都在这个平面上,该矩阵不可逆,所以这个平面包含了这些列的全部线性组合(即所有的向量
C
x
C\boldsymbol x
Cx)。式(1.3.15)将 0 也写了进去,可以看到矩阵
C
C
C 产生了 “中心差分”,
C
x
C\boldsymbol x
Cx 的行
i
i
i 是
x
i
+
1
−
x
i
−
1
x_{i+1}-x_{i-1}
xi+1−xi−1。
下面是
4
×
4
4×4
4×4 中心差分的例子:
C
x
=
b
[
0
1
0
0
−
1
0
1
0
0
−
1
0
1
0
0
−
1
0
]
[
x
1
x
2
x
3
x
4
]
=
[
x
2
−
0
x
3
−
x
1
x
4
−
x
2
0
−
x
3
]
=
[
b
1
b
2
b
3
b
4
]
C\boldsymbol x=\boldsymbol b\kern 10pt\begin{bmatrix}0&1&0&0\\-1&0&1&0\\0&-1&0&1\\0&0&-1&0\end{bmatrix}\begin{bmatrix}x_1\\x_2\\x_3\\x_4\end{bmatrix}=\begin{bmatrix}x_2-0\\x_3-x_1\\x_4-x_2\\0-x_3\end{bmatrix}=\begin{bmatrix}b_1\\b_2\\b_3\\b_4\end{bmatrix}
Cx=b
0−10010−10010−10010
x1x2x3x4
=
x2−0x3−x1x4−x20−x3
=
b1b2b3b4
这个矩阵是可逆的!但是
5
×
5
5\times5
5×5 的矩阵是奇异的
⋯
\cdots
⋯