之后的文章开始介绍线性代数的后半部分。线性代数的前半部分几乎都涉及到 Ax=b ,从现在起我们将通过化简矩阵(尽可能变成对角矩阵)来求解新问题 Ax=λx ,基本的步骤已经不是某行减去另一行的倍数:消元法会改变特征值,这不是我们需要的。
行列式是从
Ax=b
到
Ax=λx
的过渡,对于这两种情况,行列式都给出了一个形式解:在
x=A−1b
中得出克莱姆法则,而对于后一种情况,得出多项式
det(A−λI)
,它的根就是行列式(所有的矩阵都是方阵;长方形矩阵的特征和行列式都是没有意义的)。如果
n=2,3
,那么可以用行列式求解特征值,但而与较大的
n
,计算
第一部是理解行列式用处有多大,他们的应用之一是求解常微分方程,我们假设读者不是微分方程的专家!只要知道
xn,sinx,ex
就足够了。这里给出一个例子,考虑两个方程的方程组:
这是一个初值问题,在时刻 t=0 是给定了未知量的初始值 8,5 。现在的问题是求出 t>0 之后的 v(t),w(t) 。
这个方程组的矩阵形式比较容易,让
u(t)
表示未知量,初始值是
u0
,系数矩阵是
A
:
这样的话方程组就变成我们要的向量方程:
这是该问题的基本叙述,注意它是一个一阶方程组,而且关于未知量是线性的,它的系数还是常量;矩阵 A 和时间无关。
我们如何求出
这个方程的解读者应该知道:
在初始时刻
t=0
,
u
等于
注意时间变大之后
u
的行为。如果
单个方程已经见得有点多了,现在直接讨论方程组,寻找按指数方式依赖
t
的解:
或者用向量形式
对微分方程
du/dt=Au
来说,关键点是:找出纯粹的指数解。将
v=eλty,w=eλtz
代入方程得:
每项都有公共因子 eλt ,可以将其消去这个消去的前提是假设两个未知量的指数 λ 相等,然后得到:
这就是特征方程,用矩阵的形式表示为
Ax=λx
,将
u=eλtx
代入
du/dt=Au
得到
λeλtx=Aeλtx
,消去因子
eλt
后得到:
现在我们得到了基本方程,它涉及到两个未知量
λ,x
。
λ
是矩阵
A
的特征值,向量
Ax=λx 的解
注意
Ax=λx
是一个非线性方程,如果我们能找出
λ
,那么对
x
而言方程那就是线性的。事实上,我们能够用
单位矩阵是为了保存矩阵和向量的记法;方程 (A−λ)x=0 虽然简单,但是容易混淆。问题的关键点是:
向量
x
在
我们选择的
λ
需要使
A−λI
存在一个零空间。
当然每个矩阵都有一个零空间,因为向量
x=0
恒满足
Ax=λx
,但是在求解微分方程中它是没有用的,我们的目标是建立形如指数形式
eλtx
的解,所以只对那些非零向量
x
的特殊值
为此,行列式给出了一个确切的检验方法。
1、
λ
是
A
的一个特征值,当且仅当
这个方程是特征方程,每个
λ
都关联一个特征向量
x
:
在我们的例子中,我们用
λI
对
A
做变换使其变成奇异的:
注意
λ
只与对角线上的元素进行相减(因为它乘以单位矩阵
I
)。
这是特征多项式,令行列式等于0得到的根就是特征值,可以利用平常的二次方程求解,或者因式分解
λ2−λ−2=(λ+1)(λ−2)
,如果
λ=−1
或者
λ=2
,方程等于零,这个结果和二次根通式一样:
因为二次方程有两个根,所以就有两个特征值,每个 2×2 矩阵 A−λI 的行列式中都是 λ2 (没有更高的 λ 幂次了)。
λ=−1
和
λ=2
是
Ax=λx
或者
(A−λI)x=0
的解,如果矩阵是奇异的,那么在它的零空间中肯定存在非零向量
x
。事实上,零空间包含特征向量的所在的整条线;它就是一个子空间!
方程的解(第一个特征值)就是
x1
的非零倍数:
同样的可以得到
λ2
的计算结果:
第二个特征值就是
x2
的非零倍数:
读者可能注意到 A−λ1I 的列就是 x2 , A−λ2I 的列就是 x1 ,这是 2×2 矩阵的特例(这个特点是很有用的)。
对于
3×3
的情况,我经常令
x
的一个元素为1,然后求解
现在回到应用上(也就是微分方程),首先先强调一下求解 Ax=λx 的步骤:
- 计算
A−λI
的行列式。沿对角线减去
λ
,行列式是一个
n
阶多项式,第一项是
(−λ)n 。 - 找出多项式的根。这
n
个根是
A 的特征值。 - 对于每个特征值,求解 (A−λI)x=0 。因为行列式为零,所以除了 x=0 外还有解,这些解就是特征向量。
在微分方程中,有一个特解
u=eλtx
,对于
du/dt=Au
来说,这些是纯指数解,注意
e−t,e2t
:
这两个特解给出了完整解,他们可以用任何数
c1,c2
相乘然后加到一起。当
u1,u2
满足线性方程
du/dt=Au
时,他们的和
u1+u2
同样满足:
这是叠加操作,它应用到微分方程上就像应用到矩阵方程 Ax=0 上一样,零空间始终那是一个子空间,解的组合依然是解。
现在我们有两个自由参数
c1,c2
,通过初试条件
u=u(0)
可以求出他们:
解的
c1=3,c2=1
,原始方程的解是:
将两部分写开的:
关键在于特征值
λ
和特征向量
x
,特征值本身非常重要,而不仅仅是求出