本节大纲
- 对 于 方 程 A x = b 来 说 , 它 的 通 解 为 一 个 x p ( 特 解 ) + x n ( 零 空 间 里 的 任 意 向 量 , 也 可 以 认 为 是 零 空 间 中 基 向 量 的 线 性 组 合 ) \scriptsize {对于方程Ax= b来说,它的通解为一个x_p(特解) + x_n(零空间里的任意向量,也可以认为是零空间中基向量的线性组合)} 对于方程Ax=b来说,它的通解为一个xp(特解)+xn(零空间里的任意向量,也可以认为是零空间中基向量的线性组合)
- 通 过 对 增 广 矩 阵 [ A b ] 进 行 矩 阵 消 元 , 我 们 可 以 获 得 [ R d ] R 是 化 简 后 的 行 阶 梯 矩 阵 , 所 有 的 主 元 都 为 1 , 其 所 在 列 除 其 自 身 都 是 0 , A x = b 等 价 于 R x = d 。 \scriptsize 通过对增广矩阵[A \quad b]进行矩阵消元,我们可以获得[R \quad d]{\color{red}\tiny R是化简后的行阶梯矩阵,所有的主元都为1,其所在列除其自身都是0}\scriptsize,Ax = b 等价于 Rx = d。 通过对增广矩阵[Ab]进行矩阵消元,我们可以获得[Rd]R是化简后的行阶梯矩阵,所有的主元都为1,其所在列除其自身都是0,Ax=b等价于Rx=d。
- 只 有 当 化 简 后 的 行 阶 梯 矩 阵 的 所 有 零 行 ( 矩 阵 这 一 行 都 为 0 ) 对 应 的 d 相 同 的 位 置 也 为 0 , A x = b 和 R x = d 才 有 解 。 \scriptsize 只有当化简后的行阶梯矩阵的所有零行(矩阵这一行都为0)对应的d相同的位置也为0,Ax = b 和 Rx = d才有解。 只有当化简后的行阶梯矩阵的所有零行(矩阵这一行都为0)对应的d相同的位置也为0,Ax=b和Rx=d才有解。
- 当 化 简 后 的 行 阶 梯 矩 阵 可 解 时 , R x = d 的 特 解 x p 里 所 有 自 由 元 对 应 的 系 数 都 为 零 ( 这 个 是 为 了 求 解 方 便 ) \scriptsize 当化简后的行阶梯矩阵可解时,Rx = d 的特解x_p里所有自由元对应的系数都为零(这个是为了求解方便) 当化简后的行阶梯矩阵可解时,Rx=d的特解xp里所有自由元对应的系数都为零(这个是为了求解方便)
- 当 A ( m × n 的 矩 阵 ) 的 零 矩 阵 空 间 为 零 向 量 , 即 N ( A ) = 0 , 也 即 没 有 自 由 元 时 , 矩 阵 A 有 满 列 秩 , 列 秩 为 n \scriptsize 当A(m \times n 的矩阵)的零矩阵空间为零向量,即N(A) = 0,也即没有自由元时,矩阵A有满列秩,列秩为n 当A(m×n的矩阵)的零矩阵空间为零向量,即N(A)=0,也即没有自由元时,矩阵A有满列秩,列秩为n
- 当 A 的 行 空 间 C ( A ) 为 m 维 度 向 量 空 间 R m 时 , 矩 阵 的 行 秩 为 m 。 此 时 A x = b 一 定 有 解 。 \scriptsize {当A的行空间C(A)为m维度向量空间R^{m}时 ,矩阵的行秩为m。此时Ax=b一定有解。} 当A的行空间C(A)为m维度向量空间Rm时,矩阵的行秩为m。此时Ax=b一定有解。
- 关 于 矩 阵 的 秩 , 存 在 四 种 情 况 : 1. r = m = n ; 2. r = m < n ( 所 有 的 A x = b 都 是 可 解 的 ) ; 3. r = n < m ( A x = b 有 1 个 或 者 0 个 解 ) ; 4. r < m 并 且 r < n ( 0 个 或 者 无 穷 多 个 解 ) \scriptsize 关于矩阵的秩,存在四种情况:1.r=m=n; 2.r=m<n(所有的Ax = b 都是可解的);3.r=n<m(Ax=b有1个或者0个解);4.r<m 并且 r<n(0个或者无穷多个解) 关于矩阵的秩,存在四种情况:1.r=m=n;2.r=m<n(所有的Ax=b都是可解的);3.r=n<m(Ax=b有1个或者0个解);4.r<m并且r<n(0个或者无穷多个解)
详细内容
3.3.0 增广矩阵
我无法直接用语言形容增广矩阵是什么东西,但是看一下增广矩阵的构造就清楚了。假设一个方程组
[
1
3
0
2
0
0
1
4
1
3
1
6
]
⋅
[
x
1
x
2
x
3
x
4
]
=
[
1
6
7
]
\left[ \begin{matrix} 1&3&0&2\\ 0&0&1&4\\ 1&3&1&6 \end{matrix} \right] \cdot \left[ \begin{matrix} x_1\\ x_2\\ x_3\\ x_4 \end{matrix} \right] = \left[ \begin{matrix} 1\\ 6\\ 7 \end{matrix} \right]
⎣⎡101303011246⎦⎤⋅⎣⎢⎢⎡x1x2x3x4⎦⎥⎥⎤=⎣⎡167⎦⎤
这是一个Ax=b的矩阵方程,目前为止,我们构建增广矩阵就是为了更好更方便地进行行操作。构建增广矩阵[A b]
[
1
3
0
2
1
0
0
1
4
6
1
3
1
6
7
]
\left[ \begin{matrix} 1&3&0&2&\textcolor{red}{1}\\ 0&0&1&4&\textcolor{red}{6}\\ 1&3&1&6&\textcolor{red}{7} \end{matrix} \right]
⎣⎡101303011246167⎦⎤
接下来我们进行消元操作,
row3-row1:
[
1
3
0
2
1
0
0
1
4
6
0
0
1
4
6
]
\left[ \begin{matrix} 1&3&0&2&\textcolor{red}{1}\\ 0&0&1&4&\textcolor{red}{6}\\ 0&0&1&4&\textcolor{red}{6} \end{matrix} \right]
⎣⎡100300011244166⎦⎤
row3-row2:
[
1
3
0
2
1
0
0
1
4
6
0
0
0
0
0
]
\left[ \begin{matrix} \textcolor{orange}{1}&3&0&2&\textcolor{red}{1}\\ 0&0&\textcolor{orange}{1}&4&\textcolor{red}{6}\\ 0&0&0&0&\textcolor{red}{0} \end{matrix} \right]
⎣⎡100300010240160⎦⎤
两个主元我已经标出来了,而且通过消元,获得了简化的行阶梯矩阵。那么非主元列所代表的向量则为自由元。
3.3.2 获得特解
特解,就是让矩阵方程的结果能够等于目标向量的一个向量
对于我们题目的这个方程来说
[
1
3
0
2
0
0
1
4
1
3
1
6
]
⋅
[
x
1
x
2
x
3
x
4
]
=
[
1
6
7
]
\left[ \begin{matrix} 1&3&0&2\\ 0&0&1&4\\ 1&3&1&6 \end{matrix} \right] \cdot \left[ \begin{matrix} x_1\\ x_2\\ x_3\\ x_4 \end{matrix} \right] = \left[ \begin{matrix} 1\\ 6\\ 7 \end{matrix} \right]
⎣⎡101303011246⎦⎤⋅⎣⎢⎢⎡x1x2x3x4⎦⎥⎥⎤=⎣⎡167⎦⎤
我们可以有几种理解
理解矩阵方程
- 方程组
{
1
x
1
+
3
x
2
+
0
x
3
+
2
x
4
=
1
0
x
1
+
0
x
2
+
1
x
3
+
4
x
4
=
6
1
x
1
+
3
x
2
+
1
x
3
+
6
x
4
=
7
\begin{cases} 1x_1 + 3 x_2 + 0x_3 + 2 x_4 = 1 \\ 0x_1 + 0 x_2 + 1x_3 + 4 x_4 = 6\\ 1x_1 + 3 x_2 + 1x_3 + 6 x_4 = 7\\ \end{cases}
⎩⎪⎨⎪⎧1x1+3x2+0x3+2x4=10x1+0x2+1x3+4x4=61x1+3x2+1x3+6x4=7
这时候我们要求的特解,就是能让这个方程成立的一组解。但是如果我只是这么说的话,我们还是不知道该怎么求,那么让我们来继续深入地了解一下这个方程组在线性代数中代表什么。
- 向量在不同的空间中的变换
需要求的向量 [ x 1 x 2 x 3 x 4 ] T = b \bigl[ \begin{matrix} x_1 & x_2 & x_3 & x_4\end{matrix} \bigr]^T = b [x1x2x3x4]T=b (为了方便写和看,对矩阵进行了一下转置),我们可以将该向量看作在一个正儿八经的四个维度的空间内(四个基向量相互垂直,并且模长都为单位1)表示的向量,设这个空间为S4,b 左乘矩阵 A = [ 1 3 0 2 0 0 1 4 1 3 1 6 ] A= \left[ \begin{matrix} 1&3&0&2\\ 0&0&1&4\\ 1&3&1&6 \end{matrix} \right] A=⎣⎡101303011246⎦⎤
之后,我们可以认为是让向量 b 在 A 的向量空间中进行表示。在原来的正经四维空间中,向量 b 为四维空间四个正经基向量的分别X1,X2,X3,X4倍的组合,A 也有四个向量,这四个向量组合成一个空间(注意,这里只是说能,但并不是必须四个,其中两个主元列就能构成A所在的空间),将b转换到A中,b在四个坐标轴的分量应该变成了X1,X2,X3,X4四个倍数分别乘以四个构成空间的向量。我们用动图来看看这个过程—>B站视频:线性代数的本质:
以前看到矩阵相乘的时候,必须要求坐边的列数等于右边的行数,你是不是有很多小朋友的❓ 现在是不是有点感觉了?左边的向量数(列数)必须配得上右边向量的那几个系数(行数),就算右边是个矩阵,也是一样的道理,这里就先不展开了
设变换后的 b b b 为 b ′ b' b′:
b ′ = x 1 [ 1 0 1 ] + x 2 [ 3 0 3 ] + x 3 [ 0 1 1 ] + x 4 [ 2 4 6 ] = [ 1 6 7 ] b' = x_1 \left[ \begin{matrix} 1\\ 0\\ 1 \end{matrix} \right] + x_2 \left[ \begin{matrix} 3\\ 0\\ 3 \end{matrix} \right] + x_3 \left[ \begin{matrix} 0\\ 1\\ 1 \end{matrix} \right] + x_4\left[ \begin{matrix} 2\\ 4\\ 6 \end{matrix} \right] = \left[ \begin{matrix} 1\\ 6\\ 7 \end{matrix} \right] b′=x1⎣⎡101⎦⎤+x2⎣⎡303⎦⎤+x3⎣⎡011⎦⎤+x4⎣⎡246⎦⎤=⎣⎡167⎦⎤ - 向量的线性组合
从上面的结果,我们也可以理解成, b b b 内的 x 1 、 x 2 、 x 3 、 x 4 x_1、x_2、x_3、x_4 x1、x2、x3、x4是对 c 1 、 c 2 、 c 3 、 c 4 c_1、c_2、c_3、c_4 c1、c2、c3、c4 四个向量的线性组合的系数。
我们变形一下,看看奇妙的事情发生了:
b
′
=
[
1
x
1
3
x
2
0
x
3
2
x
4
0
x
1
0
x
2
1
x
3
4
x
4
1
x
1
3
x
2
1
x
3
6
x
4
]
=
[
1
6
7
]
b'= \left[ \begin{matrix} 1x_1&3x_2&0x_3&2x_4\\ 0x_1&0x_2&1x_3&4x_4\\ 1x_1&3x_2&1x_3&6x_4 \end{matrix} \right] = \left[ \begin{matrix} 1\\ 6\\ 7 \end{matrix} \right]
b′=⎣⎡1x10x11x13x20x23x20x31x31x32x44x46x4⎦⎤=⎣⎡167⎦⎤
{
1
x
1
+
3
x
2
+
0
x
3
+
2
x
4
=
1
0
x
1
+
0
x
2
+
1
x
3
+
4
x
4
=
6
1
x
1
+
3
x
2
+
1
x
3
+
6
x
4
=
7
\begin{cases} 1x_1 + 3 x_2 + 0x_3 + 2 x_4 = 1 \\ 0x_1 + 0 x_2 + 1x_3 + 4 x_4 = 6\\ 1x_1 + 3 x_2 + 1x_3 + 6 x_4 = 7\\ \end{cases}
⎩⎪⎨⎪⎧1x1+3x2+0x3+2x4=10x1+0x2+1x3+4x4=61x1+3x2+1x3+6x4=7
矩阵和方程,统一了!
Hold on! 我们要干嘛来着?这一小节不是要讨论特解吗?怎么搞的那么宏大?其实了解了这些,接下来的内容应该就好理解了
获得特解
[
1
3
0
2
0
0
1
4
0
0
0
0
]
\left[ \begin{matrix} \textcolor{orange}{1}&3&0&2\\ 0&0&\textcolor{orange}{1}&4\\ 0&0&0&0 \end{matrix} \right]
⎣⎡100300010240⎦⎤
我们看到这个通过高斯消元获得的矩阵,主元标出来了。主元是什么意思?就是这个矩阵中剩下的矩阵都可以通过这两个主元向量来表示。例如:
[
3
0
0
]
=
3
[
1
0
0
]
+
0
[
0
1
0
]
\left[ \begin{matrix} 3\\ 0\\ 0 \end{matrix} \right] = 3\left[ \begin{matrix} \textcolor{orange}{1}\\ 0\\ 0 \end{matrix} \right] + 0\left[ \begin{matrix} 0\\ \textcolor{orange}{1}\\ 0 \end{matrix} \right]
⎣⎡300⎦⎤=3⎣⎡100⎦⎤+0⎣⎡010⎦⎤
也就是说,这个空间
A
=
[
1
3
0
2
0
0
1
4
1
3
1
6
]
A= \left[ \begin{matrix} \textcolor{red}1&3&\textcolor{red}0&2\\ \textcolor{red}0&0&\textcolor{red}1&4\\ \textcolor{red}1&3&\textcolor{red}1&6 \end{matrix} \right]
A=⎣⎡101303011246⎦⎤
c
1
=
[
1
0
1
]
c
2
=
[
3
0
3
]
c
3
=
[
0
1
1
]
c
4
=
[
2
4
6
]
c_1= \left[ \begin{matrix} 1\\ 0\\ 1 \end{matrix} \right] \quad c_2= \left[ \begin{matrix} 3\\ 0\\ 3 \end{matrix} \right] \quad c_3= \left[ \begin{matrix} 0\\ 1\\ 1 \end{matrix} \right] \quad c_4= \left[ \begin{matrix} 2\\ 4\\ 6 \end{matrix} \right]
c1=⎣⎡101⎦⎤c2=⎣⎡303⎦⎤c3=⎣⎡011⎦⎤c4=⎣⎡246⎦⎤
看似由四个向量构成,其实只有上面标红的两个向量,即
c
1
、
c
2
c_1、c_2
c1、c2就行,就能把该矩阵空间所有的向量表示出来。所以这个矩阵的列空间为
R
2
R^2
R2 , 矩阵的秩为2<=>主元数为2
所以我们可以确定,A的向量空间为一个平面。 而且我们也能确定一点,也是很重要的一点
c
2
、
c
4
c_2、c_4
c2、c4对这个空间的形成毫无贡献。
那么我们来看向之前的方程:
[
1
3
0
2
0
0
1
4
1
3
1
6
]
⋅
[
x
1
x
2
x
3
x
4
]
=
[
1
6
7
]
\left[ \begin{matrix} 1&3&0&2\\ 0&0&1&4\\ 1&3&1&6 \end{matrix} \right] \cdot \left[ \begin{matrix} x_1\\ x_2\\ x_3\\ x_4 \end{matrix} \right] = \left[ \begin{matrix} 1\\ 6\\ 7 \end{matrix} \right]
⎣⎡101303011246⎦⎤⋅⎣⎢⎢⎡x1x2x3x4⎦⎥⎥⎤=⎣⎡167⎦⎤
利用之前对方程的几种理解的第三种理解方式,
[
1
6
7
]
T
\bigl[ \begin{matrix}1&6&7\end{matrix}\bigr]^T
[167]T是对
A
A
A中几个列向量的线性组合,
x
?
x_?
x?就是
A
A
A中对应列的系数,那么通过消元可知,
A
A
A的列向量
c
2
、
c
4
c_2、c_4
c2、c4为自由元,也就是说,无论他俩怎样组合,结果也都能用
c
1
、
c
3
c_1、c_3
c1、c3表示出来,也就是说:
x
1
c
1
+
x
2
c
2
+
x
3
c
3
+
x
4
c
4
x_1c_1+x_2c_2+x_3c_3+x_4c_4
x1c1+x2c2+x3c3+x4c4
这四个向量的线性组合,能够被
仅
使
用
c
1
、
c
3
的
线
性
组
合
表
示
出
来
仅使用c_1、c_3的线性组合表示出来
仅使用c1、c3的线性组合表示出来,即:
x
1
c
1
+
x
2
c
2
+
x
3
c
3
+
x
4
c
4
=
x
s
c
1
+
x
t
c
3
x_1c_1+x_2c_2+x_3c_3+x_4c_4 = x_sc_1 + x_tc_3
x1c1+x2c2+x3c3+x4c4=xsc1+xtc3
当
x
2
、
x
4
x_2、x_4
x2、x4 都为0时,
x
1
、
x
3
x_1、x_3
x1、x3 就是
x
s
、
x
t
x_s、x_t
xs、xt。
所以,为了求这个特解,我们完全可以设
x
2
、
x
4
x_2、x_4
x2、x4 为0,仅求
x
1
,
x
3
x_1,x_3
x1,x3这两个系数即可。
b
′
=
x
1
[
1
0
1
]
+
0
[
3
0
3
]
+
x
3
[
0
1
1
]
+
0
[
2
4
6
]
=
[
1
6
7
]
b' = x_1 \left[ \begin{matrix} 1\\ 0\\ 1 \end{matrix} \right] + 0\left[ \begin{matrix} 3\\ 0\\ 3 \end{matrix} \right] + x_3 \left[ \begin{matrix} 0\\ 1\\ 1 \end{matrix} \right] + 0\left[ \begin{matrix} 2\\ 4\\ 6 \end{matrix} \right] = \left[ \begin{matrix} 1\\ 6\\ 7 \end{matrix} \right]
b′=x1⎣⎡101⎦⎤+0⎣⎡303⎦⎤+x3⎣⎡011⎦⎤+0⎣⎡246⎦⎤=⎣⎡167⎦⎤
解得,
x
1
=
1
,
x
2
=
6
x_1 = 1, x_2 = 6
x1=1,x2=6,所以特解:
x
p
a
t
i
c
u
l
a
r
=
[
1
0
6
0
]
x_{paticular}= \left[ \begin{matrix} 1\\ 0\\ 6\\ 0 \end{matrix} \right]
xpaticular=⎣⎢⎢⎡1060⎦⎥⎥⎤
To be continued
下期预告:给出矩阵方程完整的通解,带你了解其中的含义。😀