方程组的“行图像”与“列图像”
对一个二元二次方程组
2
x
−
y
=
0
−
x
+
2
y
=
3
(1)
2x-y=0\\-x+2y=3 \tag{1}
2x−y=0−x+2y=3(1)
可以记为
A
X
=
b
AX=b
AX=b的行图像形式
[
2
−
1
−
1
2
]
[
x
y
]
=
[
0
3
]
(2)
\left[ \begin{matrix} 2 & -1\\ -1 & 2 \end{matrix} \right]\left[\begin{matrix}x\\y\end{matrix}\right]=\left[\begin{matrix}0\\3\end{matrix}\right] \tag{2}
[2−1−12][xy]=[03](2)
在图像上这种方式表示两条直线,其交点就是方程的解
同时方程组(1)也可记为列图像形式
x
[
2
−
1
]
+
y
[
−
1
2
]
=
[
0
3
]
(3)
x\left[\begin{matrix}2\\-1\end{matrix}\right]+y\left[\begin{matrix}-1\\2\end{matrix}\right]=\left[\begin{matrix}0\\3\end{matrix}\right] \tag{3}
x[2−1]+y[−12]=[03](3)
在图像上这种方式表示两条向量
[
2
−
1
]
T
[2\ -1]^T
[2 −1]T和
[
−
1
2
]
T
[-1\ \ 2]^T
[−1 2]T的某种线性组合得到
[
0
3
]
T
[0\ \ 3]^T
[0 3]T
可以看到,“列图像”的描述方式更直观,但 A X = b AX=b AX=b的形式更方便求解。
逆矩阵
什么情况下 A X = b AX=b AX=b有解呢?从“列图像”上看就是涉及到的向量不共线,相应的 A A A可逆(非奇异)
设A是n阶方阵,如果存在n阶方阵B,使得 A B = B A = I AB=BA=I AB=BA=I,那么称A可逆,B是其逆矩阵
如果能找到一个非0向量 X X X,使得 A X = 0 AX=0 AX=0成立,那么A不可逆
1)高斯-约旦消元法求逆
假设
A
=
[
1
3
2
7
]
A=\left[\begin{matrix}1&3\\2&7\end{matrix}\right]
A=[1237]
首先将
A
A
A与
I
I
I合为增广矩阵
A
^
=
[
1
3
1
0
2
7
0
1
]
\widehat{A}=\left[\begin{array}{lr|lr}1&3&1&0\\2&7&0&1\end{array}\right]
A
=[12371001]
然后对
A
^
\widehat{A}
A
做消元使得其左部分变成
I
I
I:
[
1
0
7
−
3
0
1
−
2
1
]
\left[\begin{array}{lr|lr}1&0&7&-3\\0&1&-2&1\end{array}\right]
[10017−2−31]
消元(行变换)后右侧即为所求:
A
−
1
=
[
7
−
3
−
2
1
]
A^{-1}=\left[\begin{matrix}7&-3\\-2&1\end{matrix}\right]
A−1=[7−2−31]
简单的证明:
对增广阵左乘某个矩阵
B
B
B:
B
[
A
∣
I
]
B[A | I]
B[A∣I]
消元后有
B
A
=
I
BA=I
BA=I,因此
B
=
A
−
1
B=A^{-1}
B=A−1
又因为右侧
B
I
=
B
BI=B
BI=B,因此消元后右侧即为所求逆矩阵
LU分解
LU分解是将一个矩阵分解为一个单位下三角矩阵和一个上三角矩阵乘积
对任意一个非奇异的方阵A,其LU分解总是存在的
LU分解主要应用在数值分析中,用来解线性方程、求逆矩阵或计算行列式
1)消元法(Doolittle算法)求LU
首先对矩阵A通过初等行变换将其变为一个上三角矩阵U,这个过程中对应的变换矩阵就变成一个单位下三角矩阵
对
A
=
[
2
1
8
7
]
A=\left[\begin{matrix}2&1\\8&7\end{matrix}\right]
A=[2817],行二加上行一的-4倍,有:
[
1
0
−
4
1
]
[
2
1
8
7
]
=
[
2
1
0
3
]
⇒
A
=
[
1
0
−
4
1
]
−
1
[
2
1
0
3
]
=
[
1
0
4
1
]
[
2
1
0
3
]
\left[\begin{matrix}1&0\\-4&1\end{matrix}\right]\left[\begin{matrix}2&1\\8&7\end{matrix}\right]=\left[\begin{matrix}2&1\\0&3\end{matrix}\right]\\\Rightarrow A=\left[\begin{matrix}1&0\\-4&1\end{matrix}\right]^{-1}\left[\begin{matrix}2&1\\0&3\end{matrix}\right]=\left[\begin{matrix}1&0\\4&1\end{matrix}\right]\left[\begin{matrix}2&1\\0&3\end{matrix}\right]
[1−401][2817]=[2013]⇒A=[1−401]−1[2013]=[1401][2013]
2)直接法
由于
A
=
[
a
11
a
12
a
21
a
22
]
=
[
1
0
l
21
1
]
[
u
11
u
12
0
u
22
]
=
[
u
11
u
12
l
21
u
11
l
21
u
12
+
u
22
]
(4)
A=\left[\begin{matrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{matrix}\right]=\left[\begin{matrix}1&0\\l_{21}&1\end{matrix}\right]\left[\begin{matrix}u_{11}&u_{12}\\0&u_{22}\end{matrix}\right]\\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ =\left[\begin{matrix}u_{11}&u_{12}\\l_{21}u_{11}&l_{21}u_{12}+u_{22}\end{matrix}\right] \tag{4}
A=[a11a21a12a22]=[1l2101][u110u12u22] =[u11l21u11u12l21u12+u22](4)
直接根据上式就可以求
l
i
j
l_{ij}
lij和
u
i
j
u_{ij}
uij
向量空间与子空间
设 R n R^n Rn是n维实向量构成的集合,如果该集合对于向量加法、数乘封闭,那么称 R n R^n Rn为向量空间
子空间是向量空间的一部分,这个集合也具有加法、数乘封闭性
显然,只包含零向量的集合也构成向量空间
零空间
零空间是 A X = 0 AX=0 AX=0的解的集合
显然零空间是向量空间
令
A
=
[
1
2
2
2
2
4
6
8
3
6
8
10
]
A=\left[\begin{matrix}1&2&2&2\\2&4&6&8\\3&6&8&10\end{matrix}\right]
A=⎣⎡1232462682810⎦⎤,求解其零空间
N
(
A
)
N(A)
N(A):
STEP1: 初等行变换为上三角形式
A
=
[
1
2
2
2
2
4
6
8
3
6
8
10
]
→
[
1
2
2
2
0
0
2
4
0
0
0
0
]
(5)
A=\left[\begin{matrix}1&2&2&2\\2&4&6&8\\3&6&8&10\end{matrix}\right]\to \left[\begin{matrix}1&2&2&2\\0&0&2&4\\0&0&0&0\end{matrix}\right] \tag{5}
A=⎣⎡1232462682810⎦⎤→⎣⎡100200220240⎦⎤(5)
SETP2:求特解
从式(5)可以看到,
A
A
A的主元(秩)有2个:
a
11
=
1
a_{11}=1
a11=1,
a
23
=
2
a_{23}=2
a23=2
对应的主列是
c
o
l
1
col_1
col1、
c
o
l
3
col_3
col3,自由列是
c
o
l
2
col_2
col2、
c
o
l
4
col_4
col4
对自由列对应的解指定0或1,带入(5)式,可以求得2组(与自由列数量一致)特解: [ 2 0 − 2 1 ] T [2\ 0\ -2\ 1]^T [2 0 −2 1]T, [ − 2 1 0 0 ] T [-2\ 1\ 0\ 0]^T [−2 1 0 0]T
STEP3:线性组合
对上述特解做线性组合就得到了
A
A
A的零空间
N
(
A
)
=
c
1
[
2
0
−
2
1
]
+
c
2
[
−
2
1
0
0
]
(6)
N(A)=c_1\left[\begin{matrix}2\\0\\-2\\1\end{matrix}\right]+c_2\left[\begin{matrix}-2\\1\\0\\0\end{matrix}\right] \tag{6}
N(A)=c1⎣⎢⎢⎡20−21⎦⎥⎥⎤+c2⎣⎢⎢⎡−2100⎦⎥⎥⎤(6)
列空间
对 A = [ 1 1 2 2 1 3 3 1 4 4 1 5 ] A=\left[\begin{matrix}1&1&2\\2&1&3\\3&1&4\\4&1&5\end{matrix}\right] A=⎣⎢⎢⎡123411112345⎦⎥⎥⎤,其所有列向量 [ 1 2 3 4 ] T [1\ 2\ 3\ 4]^T [1 2 3 4]T、 [ 1 1 1 1 ] T [1\ 1\ 1\ 1]^T [1 1 1 1]T和 [ 2 3 4 5 ] T [2\ 3\ 4\ 5]^T [2 3 4 5]T张成的空间称为列空间,记为 C ( A ) C(A) C(A)
1)显然,通过线性扩展的列空间是向量空间
2)上述C(A)是
R
4
R^4
R4的2维子空间(
[
1
2
3
4
]
T
+
[
1
1
1
1
]
T
[1\ 2\ 3\ 4]^T+[1\ 1\ 1\ 1]^T
[1 2 3 4]T+[1 1 1 1]T与
[
2
3
4
5
]
T
[2\ 3\ 4\ 5]^T
[2 3 4 5]T线性相关)
列空间研究的是,什么样的b使得 A X = b AX=b AX=b有解
上述例子可以改写为
b
=
A
X
=
[
1
1
2
2
1
3
3
1
4
4
1
5
]
[
x
1
x
2
x
3
]
=
x
1
[
1
2
3
4
]
+
x
2
[
1
1
1
1
]
+
x
3
[
2
3
4
5
]
(7)
b=AX=\left[\begin{matrix}1&1&2\\2&1&3\\3&1&4\\4&1&5\end{matrix}\right]\left[\begin{matrix}x_1\\x_2\\x_3\end{matrix}\right]=x_1\left[\begin{matrix}1\\2\\3\\4\end{matrix}\right]+x_2\left[\begin{matrix}1\\1\\1\\1\end{matrix}\right]+x_3\left[\begin{matrix}2\\3\\4\\5\end{matrix}\right] \tag{7}
b=AX=⎣⎢⎢⎡123411112345⎦⎥⎥⎤⎣⎡x1x2x3⎦⎤=x1⎣⎢⎢⎡1234⎦⎥⎥⎤+x2⎣⎢⎢⎡1111⎦⎥⎥⎤+x3⎣⎢⎢⎡2345⎦⎥⎥⎤(7)
也就是说,如果
b
b
b在
A
A
A的列空间
C
(
A
)
C(A)
C(A)内,
A
X
=
b
AX=b
AX=b有解
仍以零空间中的矩阵
A
A
A为例,求
A
X
=
b
AX=b
AX=b的所有解集合
STEP1:增广矩阵初等行变换为上三角形式
[
A
∣
b
]
=
[
1
2
2
2
b
1
2
4
6
8
b
2
3
6
8
10
b
3
]
⇒
[
1
2
2
2
b
1
0
0
2
4
b
2
−
2
b
1
0
0
0
0
b
3
−
b
2
−
b
1
]
(8)
[A|b]=\left[\begin{array}{lccc|c}1&2&2&2&b_1\\2&4&6&8&b_2\\3&6&8&10&b_3\end{array}\right]\Rightarrow \left[\begin{array}{lccc|c}1&2&2&2&b_1\\0&0&2&4&b_2-2b_1\\0&0&0&0&b_3-b_2-b_1\end{array}\right] \tag{8}
[A∣b]=⎣⎡1232462682810b1b2b3⎦⎤⇒⎣⎡100200220240b1b2−2b1b3−b2−b1⎦⎤(8)
注意上式中
b
i
b_i
bi为行向量
STEP2:令所有自由列对应的解元素为0,求特解
易得
X
p
=
[
b
2
−
b
3
0
b
3
−
b
2
−
b
1
2
0
]
X_p=\left[\begin{matrix}b_2-b_3\\0\\\frac{b_3-b_2-b_1}{2}\\0\end{matrix}\right]
Xp=⎣⎢⎢⎡b2−b302b3−b2−b10⎦⎥⎥⎤
STEP3:求A的零空间
N
(
A
)
N(A)
N(A)(使得
A
X
=
0
AX=0
AX=0成立的所有解空间)
如上述零空间内步骤,得
N
(
A
)
=
c
1
[
2
0
−
2
1
]
+
c
2
[
−
2
1
0
0
]
N(A)=c_1\left[\begin{matrix}2\\0\\-2\\1\end{matrix}\right]+c_2\left[\begin{matrix}-2\\1\\0\\0\end{matrix}\right]
N(A)=c1⎣⎢⎢⎡20−21⎦⎥⎥⎤+c2⎣⎢⎢⎡−2100⎦⎥⎥⎤
STEP4:求所有解集合
将特解
X
p
X_p
Xp与零空间
N
(
A
)
N(A)
N(A)相加即得:
X
=
[
b
2
−
b
3
0
b
3
−
b
2
−
b
1
2
0
]
+
c
1
[
2
0
−
2
1
]
+
c
2
[
−
2
1
0
0
]
(9)
X=\left[\begin{matrix}b_2-b_3\\0\\\frac{b_3-b_2-b_1}{2}\\0\end{matrix}\right]+c_1\left[\begin{matrix}2\\0\\-2\\1\end{matrix}\right]+c_2\left[\begin{matrix}-2\\1\\0\\0\end{matrix}\right] \tag{9}
X=⎣⎢⎢⎡b2−b302b3−b2−b10⎦⎥⎥⎤+c1⎣⎢⎢⎡20−21⎦⎥⎥⎤+c2⎣⎢⎢⎡−2100⎦⎥⎥⎤(9)
需要注意的是
A
X
=
b
AX=b
AX=b的所有解集合不一定是一个向量空间了(不一定过0点)
秩
如零空间内所述,秩 r a n k ( A ) rank(A) rank(A)指A的主元个数
对尺寸 m × n m\times n m×n的矩阵A,秩 r ≤ m r\leq m r≤m && r ≤ n r\leq n r≤n
1)
r
=
m
=
n
r=m=n
r=m=n
此时称A为满秩
A是方阵,并且可逆(非奇异)
A
X
=
0
AX=0
AX=0仅包含0向量(自由列数量为0)
A
X
=
b
AX=b
AX=b有且只有1个解
2)
r
=
n
<
m
r=n<m
r=n<m
此时称A为列满秩
A
X
=
0
AX=0
AX=0仅包含0向量(自由列数量为0)
A
X
=
b
AX=b
AX=b有可能存在1个解,也可能无解(方程数多于未知数)
3)
r
=
m
<
n
r=m<n
r=m<n
此时称A为行满秩
A
X
=
0
AX=0
AX=0的特解个数为
n
−
r
n-r
n−r
A
X
=
b
AX=b
AX=b有无穷多解(方程数少于未知数)
4)
r
<
m
r<m
r<m&&
r
<
n
r<n
r<n
此时
A
X
=
b
AX=b
AX=b有可能存在无穷多解,也可能无解
这里无解的情况是
A
⇒
[
I
F
0
0
]
A\Rightarrow\left[\begin{matrix}I&F\\0&0\end{matrix}\right]
A⇒[I0F0],而对应的
b
⇒
[
b
u
p
b
d
o
w
n
]
b\Rightarrow\left[\begin{matrix}b_{up}\\b_{down}\end{matrix}\right]
b⇒[bupbdown]中
b
d
o
w
n
≠
0
b_{down}\neq0
bdown=0
否则就特化为情况3,拥有无穷多解