A x = b \mathbf A \boldsymbol x=\boldsymbol b Ax=b与 A x = 0 \mathbf A \boldsymbol x=\boldsymbol 0 Ax=0的区别在于:
- 对于齐次线性方程组
A
x
=
0
\mathbf A \boldsymbol x=\boldsymbol 0
Ax=0,无论左侧系数矩阵如何做行变换,右侧的系数始终为
0
\boldsymbol 0
0;
A x = 0 \mathbf A \boldsymbol x=\boldsymbol 0 Ax=0必定有解,只是解空间可能有大有小(唯一零解?无穷解?) - 然而对于
A
x
=
b
\mathbf A \boldsymbol x=\boldsymbol b
Ax=b,消元时,右侧的
b
\boldsymbol b
b和左侧系数矩阵
A
\mathbf A
A一同变换,我们需要考虑增广矩阵
[
A
b
]
\begin{bmatrix}\mathbf A&\boldsymbol b\end{bmatrix}
[Ab]
A x = b \mathbf A \boldsymbol x=\boldsymbol b Ax=b可能无解,也可能有解;有解可能是唯一解/无穷解
A
x
=
b
\mathbf A \boldsymbol x=\boldsymbol b
Ax=b有解,一定要保证:一旦左侧某几行的线性组合为全0,右侧的系数也必须为0(消元后方程始终满足"0=0"的约束)
例如,
[
A
b
]
=
[
1
2
2
2
b
1
2
4
6
8
b
2
3
6
8
10
b
3
]
\begin{bmatrix}\mathbf A&\boldsymbol b\end{bmatrix}=\begin{bmatrix}1&2&2&2&b_1\\2&4&6&8&b_2\\3&6&8&10&b_3\end{bmatrix}
[Ab]=
1232462682810b1b2b3
,消元后得到
[
1
2
2
2
b
1
0
0
2
4
b
2
−
2
b
1
0
0
0
0
b
3
−
b
2
−
b
1
]
\begin{bmatrix}1&2&2&2&b_1\\0&0&2&4&b_2-2b_1\\0&0&0&0&b_3-b_2-b_1\end{bmatrix}
100200220240b1b2−2b1b3−b2−b1
,则必须满足
b
3
−
b
2
−
b
1
=
0
b_3-b_2-b_1=0
b3−b2−b1=0
A x = b \mathbf A \boldsymbol x=\boldsymbol b Ax=b有解的条件
- 对于增广矩阵 [ A b ] \begin{bmatrix}\mathbf A&\boldsymbol b\end{bmatrix} [Ab],若 A \mathbf A A某几行的线性组合得到全0行,对应的 b \boldsymbol b b侧也为0,则方程 A x = b \mathbf A \boldsymbol x=\boldsymbol b Ax=b有解;或者说:方程消元后不会出现“0=1”的情况
为什么这样就能肯定方程有解呢?
首先这是在说,各个方程之间没有“互相矛盾”(消元后没出现"0=1")
其次,我们从最后一个主元开始求解,依次向上回带,一定根据方程的约束解出未知量,但具体有多少个解就不一定了
- 上一条为“现象”,其本质在于:
- 当
A
\mathbf A
A的列空间
C
(
A
)
C(\mathbf A)
C(A)包含向量
b
\boldsymbol b
b时,方程
A
x
=
b
\mathbf A \boldsymbol x=\boldsymbol b
Ax=b有解
或者等价地说: R a n k ( A ) = 增广矩阵的秩 R a n k ( A ∣ b ) Rank(\mathbf A)=增广矩阵的秩Rank(\mathbf A|\mathbf b) Rank(A)=增广矩阵的秩Rank(A∣b)
[矩阵乘法角度]这就是说,列向量的线性组合能够得到 b \boldsymbol b b
[几何意义角度]矩阵 A \mathbf A A线性变换后的空间(基为列向量),包含 b \boldsymbol b b
因此,我们可以先求列空间,然后判断是否有解
求解 A x = b \mathbf A \boldsymbol x=\boldsymbol b Ax=b
求解 A x = b \mathbf A \boldsymbol x=\boldsymbol b Ax=b, A x = b \mathbf A \boldsymbol x=\boldsymbol b Ax=b的一个特解 + A x = 0 \mathbf A \boldsymbol x=\boldsymbol 0 Ax=0的所有可能解 = A x = b \mathbf A \boldsymbol x=\boldsymbol b Ax=b的所有可能解
具体步骤: A x = b \mathbf A \boldsymbol x=\boldsymbol b Ax=b使用5-3所讲的消元法得到一个特解, A x = 0 \mathbf A \boldsymbol x=\boldsymbol 0 Ax=0使用消元法得到解空间/零空间,两者叠加即可
也就是说, A x = b \mathbf A \boldsymbol x=\boldsymbol b Ax=b的解 x \boldsymbol x x对应不过原点的平面,因此称为通解(不是线性空间);
而 A x = 0 \mathbf A \boldsymbol x=\boldsymbol 0 Ax=0的解 x \boldsymbol x x对应过原点的平面,称为解空间(是一个线性空间)
- 原因: x p x_p xp为 A x = b \mathbf A \boldsymbol x=\boldsymbol b Ax=b的特解, x n x_n xn为 A x = 0 \mathbf A \boldsymbol x=\boldsymbol 0 Ax=0的所有可能解( A \mathbf A A的零空间中的所有向量),那么有 A x p = b \mathbf A \boldsymbol x_p=\boldsymbol b Axp=b和 A x n = 0 \mathbf A \boldsymbol x_n=\boldsymbol 0 Axn=0,两个方程相加,得到 A ( x p + x n ) = b \mathbf A \boldsymbol {(x_p+x_n)}=\boldsymbol b A(xp+xn)=b,从而所有 ( x p + x n ) \boldsymbol {(x_p+x_n)} (xp+xn)都是方程 A x = b \mathbf A \boldsymbol x=\boldsymbol b Ax=b的解
- 注意, A x = b \mathbf A \boldsymbol x=\boldsymbol b Ax=b的解空间一定不是向量空间,因为不含 0 \boldsymbol 0 0向量,这个解空间可以理解为: A x = 0 \mathbf A \boldsymbol x=\boldsymbol 0 Ax=0的零空间(向量空间)与方程特解向量 x p x_p xp的叠加(零空间做平移,好比y=x到y=x+b的平移),称为线性流形/超平面(2维以上的线性流形)
从(消元后的)行简化阶梯型 R \mathbf R R来分析方程解的情况
定义秩 R a n k ( A ) = r Rank(\mathbf A)=r Rank(A)=r: m m m行 n n n列的系数矩阵 A \mathbf A A消元结束后, r r r也是主元的个数,并且必有 r ≤ m r\leq m r≤m和 r ≤ n r\leq n r≤n
- 方程是否有解,就要看
R
\mathbf R
R是否出现全0行
如果出现了全0行,右边的 b \boldsymbol b b对应为0,才有解;否则无解 - 通过
R
\mathbf R
R中的自由变量个数
n
−
r
n-r
n−r,可以判断方程解的个数
0个自由变量则方程有唯一解;1个及以上自由变量,方程有无穷解(自由变量有几个,基础解系中的向量就有几个,从而零空间的维度就是几)
具体对应到各个情况:
- R a n k ( A ) = m = n Rank(\mathbf A)=m=n Rank(A)=m=n,行简化阶梯型 R = I \mathbf R=\mathbf I R=I,无全0行,方程必有解,且自由变量个数为 0 0 0,有唯一解
- R a n k ( A ) = n < m Rank(\mathbf A)=n<m Rank(A)=n<m, R = [ I 0 ] \mathbf R=\begin{bmatrix}\mathbf I\\ \mathbf 0\end{bmatrix} R=[I0],当对应行的 b \boldsymbol b b为0时方程才有解;若有解,自由变量个数为 0 0 0,唯一解
- R a n k ( A ) = m < n Rank(\mathbf A)=m<n Rank(A)=m<n, R = [ I F ] \mathbf R=\begin{bmatrix}\mathbf I& \mathbf F\end{bmatrix} R=[IF](重新排列变量后可得到此形式),无全0行,方程必有解,自由变量个数为 n − r > 0 n-r>0 n−r>0,有无穷解(零空间至少是一条直线)
- R a n k ( A ) < n 且 R a n k ( A ) < m Rank(\mathbf A)<n且Rank(\mathbf A)<m Rank(A)<n且Rank(A)<m, R = [ I F 0 0 ] \mathbf R=\begin{bmatrix}\mathbf I& \mathbf F\\ \mathbf 0&\mathbf 0\end{bmatrix} R=[I0F0],当对应行的 b \boldsymbol b b为0时方程才有解;若有解,自由变量个数为 n − r > 0 n-r>0 n−r>0,有无穷解
总之,
A
\mathbf A
A的零空间维数
d
i
m
[
N
(
A
)
]
dim[N(\mathbf A)]
dim[N(A)]=消元后的自由列个数
n
−
R
a
n
k
(
A
)
n-Rank(\mathbf A)
n−Rank(A)
秩
R
a
n
k
(
A
)
Rank(\mathbf A)
Rank(A)=矩阵
A
\mathbf A
A的主元列个数=
A
\mathbf A
A线性无关列向量的最大个数=
A
\mathbf A
A的列空间维数
d
i
m
[
C
(
A
)
]
dim[C(\mathbf A)]
dim[C(A)]
秩
R
a
n
k
(
A
)
Rank(\mathbf A)
Rank(A)决定了方程解的结构(有没有解、有唯一/无穷解)
小结:从秩的角度看方程
定义秩 R a n k ( A ) = r Rank(\mathbf A)=r Rank(A)=r: m m m行 n n n列的系数矩阵 A \mathbf A A消元结束后,主元的个数,并且必有 r ≤ m r\leq m r≤m和 r ≤ n r\leq n r≤n
理论基础是
A
x
=
b
\mathbf A \boldsymbol x=\boldsymbol b
Ax=b的通解=
A
x
=
b
\mathbf A \boldsymbol x=\boldsymbol b
Ax=b的一个特解 +
A
x
=
0
\mathbf A \boldsymbol x=\boldsymbol 0
Ax=0的零空间
在此基础上,有下列结论(可以交叉搭配):
- 若
r
=
n
r=n
r=n,那么那么
A
x
=
0
\mathbf A \boldsymbol x=\boldsymbol 0
Ax=0有唯一零解,进而
A
x
=
b
\mathbf A \boldsymbol x=\boldsymbol b
Ax=b(如果有解)有唯一解
r = n r=n r=n意味着方程 A x = 0 \mathbf A \boldsymbol x=\boldsymbol 0 Ax=0每一列都有一个主元,所有变量都是主变量
⟺ \iff ⟺自由变量个数为 n − r = 0 n-r=0 n−r=0个
⟺ \iff ⟺列向量线性无关(线性无关定义就是 A x = 0 \mathbf A \boldsymbol x=\boldsymbol 0 Ax=0有唯一零解)
⟺ \iff ⟺零空间只有零向量(维度 n − r = 0 n-r=0 n−r=0,即 n = r n=r n=r) - 若
r
=
m
r=m
r=m,那么对于任意
b
\boldsymbol b
b,
A
x
=
b
\mathbf A \boldsymbol x=\boldsymbol b
Ax=b必定有解
原因:行满秩意味着消元完成后,左侧的 A \mathbf A A不可能出现全0行,因此不会出现方程相互矛盾的情况(如"0=1"),必有解 - 若
r
<
m
r<m
r<m,则
A
x
=
b
\mathbf A \boldsymbol x=\boldsymbol b
Ax=b不一定有解(需要观察,若消元后出现0=0的行则无解)
或者说, A x = b \mathbf A \boldsymbol x=\boldsymbol b Ax=b有解的条件: R a n k ( A ) = 增广矩阵的秩 R a n k ( A ∣ b ) Rank(\mathbf A)=增广矩阵的秩Rank(\mathbf A|\mathbf b) Rank(A)=增广矩阵的秩Rank(A∣b)