1. 前言
本文的理论知识基于系列视频: 线性代数的本质。侵删
阅读本文需要的前置知识:
- 向量组的概念
- 矩阵可以视为一种线性变换
- 任意的线性变换“零点”位置不改变
- 行列式 ≠ 0 => 线性变换不可逆,并产生降维
- 线性相关无关的几何意义
- 会计算 Ax = b 的通解
- 矩阵和三维空间的基的关系
2. 语义
2.1 Ax 的语义
假
设
A
=
[
1
0
0
0
1
0
0
0
0
]
假设A = \begin{bmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 0 \\ \end{bmatrix}
假设A=⎣⎡100010000⎦⎤
假
设
x
=
[
1
2
0
]
假设 x = \begin{bmatrix} 1 \\ 2 \\ 0 \\ \end{bmatrix}
假设x=⎣⎡120⎦⎤
将三维空间中的向量x做线性变换。
2.2 Ax = b 和 Ax = 0 的语义
- 一般解释 : 将三维空间中的向量x做线性变换得到b,x可为任意向量。
- 题目中的语义 :已知目标向量b,该目标向量可以由未知向量x经过A的线性变化得到,求所有x
- 延展 :Ax = 0 是目标向量b = 0向量的特殊情况
2.3 三阶方阵 Ax = 0 与基础解系
2.3.1 只有零解 只 有 零 解 = > 当 且 仅 当 x = 0 向 量 等 式 成 立 = > 线 性 变 换 一 定 是 可 逆 = > A 满 秩 只有零解 => 当且仅当x = 0向量等式成立 => 线性变换一定是可逆 => A满秩 只有零解=>当且仅当x=0向量等式成立=>线性变换一定是可逆=>A满秩
2.3.2 有非零解 必存在基础解系
降成二维
A
的
线
性
变
换
是
一
个
不
可
逆
变
换
=
>
发
生
了
降
维
=
>
A
不
满
秩
A的线性变换是一个不可逆变换 => 发生了降维 => A不满秩
A的线性变换是一个不可逆变换=>发生了降维=>A不满秩
某
一
个
直
线
上
的
所
有
向
量
被
压
缩
到
了
零
点
:
某一个直线上的所有向量被压缩到了零点:
某一个直线上的所有向量被压缩到了零点:
所以此时降维的A变换,作用于某一个直线上的所有向量,都会被压缩到零点,只要我们规定一个标量,x的取值是无限的。也就是此时x有无穷个解。如何写出标量,就是另外一个话题了
无穷个解分布在一条直线上,则只用一个基础解系就能表示这无穷个解,
可
记
为
x
=
k
ξ
可记为 x = k ξ
可记为x=kξ
降成一维
会
有
一
个
平
面
的
向
量
被
压
缩
到
了
原
点
会有一个平面的向量被压缩到了原点
会有一个平面的向量被压缩到了原点
同理,任取这个平面上的两个线性无关的向量可以组成一个基础解系,表示所有x。
可
记
为
x
=
k
1
ξ
1
+
k
2
ξ
2
可记为 x = k1 ξ1 + k2 ξ2
可记为x=k1ξ1+k2ξ2
3. 零空间
零空间定义在线性变换前的某一个空间,这个空间内的所有向量经过A的线性变化后,所有零空间的向量都会压缩至零点,所有线性变化都有零空间,对于三阶矩阵:
-
可逆矩阵:零空间为零点
-
秩为2的矩阵,零空间为直线
-
秩为1的矩阵,零空间为一个平面
-
惊奇的发现 三阶矩阵Ax=0基础解系所构成的
直线
或平面
就是零空间
4. 严格区分:张成的空间 与 零空间
假 设 A = [ 1 0 0 0 1 0 0 0 0 ] 假设A = \begin{bmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 0 \\ \end{bmatrix} 假设A=⎣⎡100010000⎦⎤
-
矩阵A 张成的空间
-
矩阵A的零空间
5. 用张成空间 理解Ax = b 的解情况
5.1 A可逆
5.1.1 有唯一解
有唯一解,没有产生降维,向量x经过线性变换唯一确认成向量b。此时线性变换A张成在整个三维空间,b也在A张成的空间中,即b能被A中的向量表示,即A和b组成的向量组线性无关, 所以R(A | b) = n
线
性
变
换
A
一
定
是
可
逆
线性变换A一定是可逆
线性变换A一定是可逆
=
>
R
(
A
)
满
秩
=> R(A) 满秩
=>R(A)满秩
=
>
R
(
A
)
=
R
(
A
∣
b
)
=
n
=> R(A) = R(A | b) = n
=>R(A)=R(A∣b)=n
5.2 A不可逆
A不可逆,线性变化产生降维。经过线性变换A, 矩阵的空间中全部向量张成在一条直线(R = 1)或者一个平面(R = 2)内。 对于方程是否有解的情况,主要取决于目标向量b是否在矩阵张成的空间中。如何检验b是否在矩阵张成的空间呢: 使 用 线 性 相 关 无 关 的 定 义 = > 用 R ( A ∣ b ) = ? = R ( A ) 判 断 使用线性相关无关的定义 => 用R(A|b) =?= R(A)判断 使用线性相关无关的定义=>用R(A∣b)=?=R(A)判断
5.2.1 有无数个解 线 性 变 化 A 一 定 不 可 逆 线性变化A一定不可逆 线性变化A一定不可逆 = > R ( A ) = R ( A ∣ b ) < n =>R(A) = R(A|b) < n =>R(A)=R(A∣b)<n
5.2.2 无解
线 性 变 化 A 一 定 不 可 逆 线性变化A一定不可逆 线性变化A一定不可逆 = > R ( A ) < R ( A ∣ b ) =>R(A) < R(A|b) =>R(A)<R(A∣b)
6. 用特解映射、零空间 理解Ax = b 的解结构
A x = b 有 解 { ξ ∗ + ( A x = 0 的 基 础 解 系 ) 有 无 穷 解 ξ 有 唯 一 解 Ax = b 有解 \begin{cases} ξ^* + (Ax=0的基础解系) &\text{} 有无穷解 \\ ξ &\text{} 有唯一解 \end{cases} Ax=b有解{ξ∗+(Ax=0的基础解系)ξ有无穷解有唯一解
6.1 解释无穷多个解的来源
6.1.2 来源于特解
特
解
ξ
∗
可
以
举
出
很
多
个
,
因
为
线
性
变
换
降
维
,
则
b
可
以
映
射
多
个
x
,
如
图
:
特解 ξ^* 可以举出很多个,因为线性变换降维,则b可以映射多个x,如图:
特解ξ∗可以举出很多个,因为线性变换降维,则b可以映射多个x,如图:
6.1.3 来源于零空间
零空间,也就是Ax=0 基础解系张成的空间。
x
=
k
1
ξ
1
+
k
2
ξ
2
x = k1 ξ1 + k2 ξ2
x=k1ξ1+k2ξ2
6.1.4 总的解结构
x = ξ ∗ + k 1 ξ 1 + k 2 ξ 2 x =ξ^* + k1 ξ1 + k2 ξ2 x=ξ∗+k1ξ1+k2ξ2
6.1.5 Ax=b 的通解可以代表所有解
与常微分方程(考研的另外一个考点)不同,线代Ax=b 可以代表所有解
假
设
A
=
[
1
0
0
0
1
0
0
0
1
]
假设A = \begin{bmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \\ \end{bmatrix}
假设A=⎣⎡100010001⎦⎤
已
知
A
矩
阵
可
以
表
示
为
x
=
k
1
[
1
0
0
]
+
k
2
[
0
1
0
]
+
k
3
[
0
0
1
]
=
>
整
个
三
维
空
间
的
向
量
已知A 矩阵可以表示为 x = k1 \begin{bmatrix} 1 \\ 0 \\ 0 \\ \end{bmatrix} + k2 \begin{bmatrix} 0 \\ 1 \\ 0 \\ \end{bmatrix} +k3 \begin{bmatrix} 0 \\ 0 \\ 1 \\ \end{bmatrix} => 整个三维空间的向量
已知A矩阵可以表示为x=k1⎣⎡100⎦⎤+k2⎣⎡010⎦⎤+k3⎣⎡001⎦⎤=>整个三维空间的向量
A
x
=
b
的
通
解
结
构
x
=
ξ
∗
+
k
1
ξ
1
+
k
2
ξ
2
=
>
一
个
三
维
受
限
空
间
Ax = b 的通解结构 x =ξ^* + k1 ξ1 + k2 ξ2 => 一个三维受限空间
Ax=b的通解结构x=ξ∗+k1ξ1+k2ξ2=>一个三维受限空间
Ax = b 的基础解系是可以表示所有的解,这些解都在一个受限三维空间里,并不影响通解的无数种表达方式。就好像积分区域无限细分,f(ξ)取值是无穷的,但是积分区域是受限的
6.2 特解和基础解系线性无关
6.2.1 反证法
如 果 ξ ∗ 和 ξ 1 , ξ 2 线 性 相 关 如果 ξ^* 和 ξ1,ξ2 线性相关 如果ξ∗和ξ1,ξ2线性相关 = > ξ ∗ , ξ 1 , ξ 2 都 在 同 一 个 零 空 间 中 => ξ^*, ξ1,ξ2 都在同一个零空间中 =>ξ∗,ξ1,ξ2都在同一个零空间中 = > ξ ∗ , ξ 1 , ξ 2 经 过 线 性 变 换 会 压 缩 到 零 点 => ξ^*, ξ1,ξ2 经过线性变换会压缩到零点 =>ξ∗,ξ1,ξ2经过线性变换会压缩到零点 = > A x = b 无 解 , 与 A x = b 有 无 穷 个 解 相 悖 => Ax = b 无解,与Ax = b有无穷个解相悖 =>Ax=b无解,与Ax=b有无穷个解相悖 = > ξ ∗ 和 ξ 1 , ξ 2 线 性 无 关 => ξ^* 和 ξ1,ξ2 线性无关 =>ξ∗和ξ1,ξ2线性无关
7. 补充:线性相关无关的几何意义
先给出数学上的定义(摘至百度),后文再归纳一下具体的几何意义
7.1 一维空间
最简单的情况:n个平行向量组成一个向量组时,我们说这n个向量线性相关。
稍微复杂点的情况:向量组α1 α2 α3 ....... αn
任意存在一对平行的向量,则该向量组线性相关。
7.2 二维空间
-
兼容一维
一维空间中线性相关的向量组,在二维空间中同样成立 -
二维独有特性:
从一维推广而来,如果存在向量α
和β
不平行,则这两个向量线性无关。同时,这两个向量可以张成为一个平面σ
。任意落在平面σ
的向量γ
与α 和 β
线性相关。若γ
未落在平面σ
上,三者线性无关,且三者能张成为一个三维空间。
7.3 三维空间
- 兼容一维和二维
一、二维空间中线性相关的向量组,在三维空间中同样成立 - 三维独有特性
研究三维的相关无关需要兼容一二维度的情况,已经相对复杂了。研究三维的降维情况(也就是3阶矩阵行列式 = 0时),能帮助理解什么是Ax=0的基础解系,还有通解的形式的由来。
7.4 不同维度下向量相关无关总结
线性相关是一个整体的概念。我们不能说某一个向量线性无关,我们仅能描述向量组中的向量是否线性相关。