矩阵论——再探Jordan分解

PleaseWakeUp!

已于 2024-12-04 14:23:51 修改

阅读量890

点赞数 23

文章标签：矩阵

于 2024-11-24 20:44:10 首次发布

本文链接：https://blog.csdn.net/m0_67575747/article/details/144013105

版权

警告：本文仅作为笔者对整个 $J or d an$ 分解脉络的思考和理解，所用公式定理可能表述不严谨，且也不对其进行严格的数学证明。故本文仅适合学完 $J or d an$ 分解后一头雾水的读者，对完全没学过 $J or d an$ 分解的人并不友好！

由 $S c h u r$ 定理知，任一复方阵相似于上三角矩阵。如果是更特殊的单纯矩阵，我们可以将其“相似到”对角矩阵。一个很自然的问题是，对于其他一般的矩阵而言，其能“相似到”的介于一般的上三角矩阵和特殊的对角矩阵之间的最简形式是什么样子？

这个问题似乎不难回答， $S c h u r$ 分解已经帮助我们找到任一复方阵能“相似到”的上三角形式，离最终的最简形式好像只有一步之遥了。实则不然，这一小步很难直接迈过去。在 $n$ 阶单纯矩阵相似对角化的过程中，我们是将它的 $n$ 个线性无关的特征向量组装成可逆矩阵 $P$ ，使得 $P^{-1}AP=\Lambda$ ，从而完成对角化。但是非单纯矩阵一定找不到 $n$ 个线性无关的特征向量，那也就注定无法直接构造相应的矩阵 $P$ 。

为此，引入 $\lambda$ 矩阵的概念和理论帮助我们绕路而行，曲线救国。

定理1 两个 $\lambda$ 矩阵相抵 $\Leftrightarrow$ 相同的各阶行列式因子 $\Leftrightarrow$ 相同的不变因子(相同的 $S mi t h$ 标准形) $\Leftrightarrow$ 相等的秩和相同的初等因子

定理 $1$ 涉及到的理论一般矩阵论的教科书都会介绍到，本文不详细展开，懂的都懂。下面的定理 $2$ 则是联系数字矩阵与 $\lambda$ 矩阵的关键定理：

定理2 复方阵 $A$ 和 $B$ 相似当且仅当它们的特征矩阵 $\lambda I-A$ 与 $\lambda I-B$ 相抵

因为有了定理 $1$ 和定理 $2$ ，当给出一个数字矩阵 $A$ ，我们希望找到一个与之相似而又形式较为简单(介于一般的上三角矩阵和特殊的对角矩阵之间)的数字矩阵 $B$ 时，我们并不一定要在数字矩阵的苦海内挣扎，而是可以通过找到与 $\lambda I-A$ 相抵的另一个 $\lambda$ 矩阵，那么这个 $\lambda$ 矩阵所对应的数字矩阵和原来的 $A$ 一定是相似的。在此基础上，如果我们还能够精心设计这个 $\lambda$ 矩阵使得这个 $\lambda$ 矩阵所对应的数字矩阵恰是我们想要的介于一般的上三角矩阵和特殊的对角矩阵之间的最简形式，那就完成了我们的目标！

所以如果把定理 $1$ 和定理 $2$ 连起来写就是这样的：

复方阵 $A$ 和 $B$ 相似 $\Leftrightarrow$ $\lambda I-A$ 与 $\lambda I-B$ 相抵 $\Leftrightarrow$ $\lambda I-A$ 与 $\lambda I-B$ 具有相同的各阶行列式因子 $\Leftrightarrow$ $\lambda I-A$ 与 $\lambda I-B$ 具有相同的不变因子(相同的 $S mi t h$ 标准形) $\Leftrightarrow$ $\lambda I-A$ 与 $\lambda I-B$ 具有相等的秩和相同的初等因子

实际上对于两个 $n$ 阶复方阵 $A$ 和 $B$ (应该没有人会去判定不同阶的矩阵是否相似的吧)而言，它们的特征矩阵 $\lambda I-A$ 与 $\lambda I-B$ 一定都是满秩的，故秩自然相等皆为 $n$ ，所以上面一系列的等价条件最后一个可以把“具有相等的秩”这一条删去，即：

复方阵 $A$ 和 $B$ 相似 $\Leftrightarrow$ $\lambda I-A$ 与 $\lambda I-B$ 相抵 $\Leftrightarrow$ … $\Leftrightarrow$ $\lambda I-A$ 与 $\lambda I-B$ 具有相同的初等因子

现在，我们的任务变成了要去构造一个与 $\lambda I-A$ 相抵的 $\lambda$ 矩阵，且它的形式也必须要比较简单(否则它对应的数字矩阵形式不会简单)。又一个很自然的问题是， $\lambda$ 矩阵相抵的充要条件有很多(行列式因子/不变因子/初等因子)，我们到底选择哪一个去构造？下面的定理 $3$ 或许能给我们一些提示：

定理3 设 $\lambda$ 矩阵 $D(\lambda)$ 为对角块矩阵，即 $D(\lambda)=diag(D_1(\lambda),\cdots,D_s(\lambda))$ 则 $D_1(\lambda),\cdots,D_s(\lambda)$ 初等因子的全体就是 $D(\lambda)$ 的全部初等因子，其中 $D_i(\lambda)(i=1,\cdots,s)$ 是适当阶数的 $\lambda$ 矩阵

这意味着如果对于特征矩阵 $\lambda I-A$ 的每个初等因子，我们都去构造一个含有与之相同且唯一的初等因子的 $\lambda$ 矩阵 $D_i(\lambda)$ ，再把这一系列 $D_i(\lambda)$ 组成大的对角块矩阵 $D(\lambda)$ ，那么此时的 $D(\lambda)$ 不就和 $\lambda I-A$ 具有完全一致的初等因子了吗，若再将 $D(\lambda)$ 视作数字矩阵 $D$ 的特征矩阵 $\lambda I-D$ ，那么 $D$ 和 $A$ 就是相似的。

再一个很自然的问题，如何去精心设计上面提到的一系列 $D_i(\lambda)$ 呢？也就是说，对于 $\lambda I-A$ 的第 $i$ 个形如 $(\lambda-\lambda_i)^{n_i}$ 的初等因子，如何构造相应的 $D_i(\lambda)$ 使得它的初等因子有且仅有一个，恰为 $(\lambda-\lambda_i)^{n_i}$ 。这里我们需要调用自己惊人的注意力，发现这样一个 $\lambda$ 矩阵
$\left[ \begin{matrix} \lambda-\lambda_i & -1 \\ & \lambda-\lambda_i & -1\\ & & \ddots & \ddots\\ & & & \lambda-\lambda_i & -1\\ & & & & \lambda-\lambda_i \\ \end{matrix} \right]_{n_i \times n_i} \tag{1}$ 求矩阵 $(1)$ 的初等因子 $\Rightarrow$ 求不变因子 $\Rightarrow$ 求各阶行列式因子，矩阵 $(1)$ 的各阶行列式因子我们不从 $1$ 阶慢慢开始往高阶看，我们从高阶往低阶看，矩阵 $(1)$ 的 $n_i$ 阶行列式因子即为其本身的行列式 $(\lambda-\lambda_i)^{n_i}$ ，再到它的 $n_i-1$ 阶行列式因子，我们只需要观察矩阵 $(1)$ 删去第一列和最后一行元素后留下来的右上角的 $n_i-1$ 阶子块 $(2)$ 即可
$\left[ \begin{matrix} & -1 \\ & \lambda-\lambda_i & -1\\ & & \ddots & \ddots\\ & & & \lambda-\lambda_i & -1\\ \end{matrix} \right]_{(n_i-1)\times (n_i-1)} \tag{2}$ 我们发现矩阵 $(2)$ 的行列式要么 $+ 1$ 要么 $- 1$ ，这意味着矩阵 $(1)$ 的全部 $n_i-1$ 阶子式的首 $1$ 最大公因式只能是 $1$ ，即矩阵 $(1)$ 的 $n_i-1$ 阶行列式因子必为 $1$ 。同理，我们再把 $(2)$ 的第一行和第一列元素删去，又得到矩阵 $(1)$ 的 $n_i-2$ 阶子块，这个子块行列式同样要么 $+ 1$ 要么 $- 1$ ，又说明矩阵 $(1)$ 的 $n_i-2$ 阶行列式因子也必为 $1$ ……一直进行下去，我们得出结论：矩阵 $(1)$ 的前 $n_i-1$ 阶行列式因子均为 $1$ ， $n_i$ 阶行列式因子为 $(\lambda-\lambda_i)^{n_i}$ $\Rightarrow$ 矩阵 $(1)$ 的前 $n_i-1$ 个不变因子均为 $1$ ，第 $n_i$ 个不变因子为 $(\lambda-\lambda_i)^{n_i}$ $\Rightarrow$ 矩阵 $(1)$ 有且仅有一个初等因子 $(\lambda-\lambda_i)^{n_i}$ 。

至此，我们终于说明了构造的矩阵 $(1)$ 就是符合要求的 $D_i(\lambda)$ ，由于

【先求出所需要的一系列

D_i(\lambda)

后组装为对角阵

D(\lambda)

再去求对应的数字矩阵

D

】和【先把每一个

D_i(\lambda)

求出对应的数字矩阵

D_i

再将

D_i

组装为对角阵

D

】
这两种顺序得到的结果是一样的，我们可以先把矩阵

(1)

求出它对应的数字矩阵

(3)

\left[ \begin{matrix} \lambda_i & 1 \\ & \lambda_i & 1\\ & & \ddots & \ddots\\ & & & \lambda_i & 1\\ & & & & \lambda_i \\ \end{matrix} \right]_{n_i \times n_i} \tag{3}

那么恭喜你，成功解锁

J or d an

块！针对

\lambda I-A

的每个初等因子，我们都构造出了一个相应的

J or d an

块，再把这些

J or d an

块组装为对角块矩阵，就得到了矩阵

A

的

J or d an

标准形！

J or d an

标准形非零元素只会出现在主对角线和其上方的次对角线中，其他位置一定都是

0

！

重新审视上述从矩阵 $(1)$ 到矩阵 $(2)$ 再到矩阵 $(3)$ 的分析过程，我们不难发现当 $J or d an$ 块(即矩阵 $(3)$ )发生如下 $3$ 种变化时都不影响它所对应的那个特征矩阵有且仅有一个初等因子 $(\lambda-\lambda_i)^{n_i}$ ：
①次对角线元素不是全 $1$ 而是全 $2$ ；
②次对角线元素是彼此不相同的非零数；
③主对角线下方的次对角线全 $1$ ，上方的次对角线全0(其实就是做个转置).
也就是说这三种变化后的矩阵我们都可以认为是广义上的 $J or d an$ 块。

最后一个很自然的问题， $J or d an$ 块(即矩阵 $(3)$ )次对角线上的非零元素能不能丢掉其中若干个使其为 $0$ ？其实这个问题相当于在问我们构造出的 $J or d an$ 标准形到底是不是我们一开始提出的介于一般的上三角矩阵和特殊的对角矩阵之间的最简形式——其实确实是的。我们可以举个例子，不做严格证明，因为我不会。
$\left[ \begin{matrix} 1 & 1 \\ & 1 & 1\\ & & 1\\ \end{matrix} \right] \tag{4}$ 显然矩阵 $(4)$ 是一个 $J or d an$ 块，当我们把次对角线上的两个 $1$ 的一个或者两个变成 $0$ 时，再去计算它的初等因子你会发现和原来不一样了，也就是说这个 $J or d an$ 块已经不能再简化了。

最后，当给定数字矩阵 $A$ 时，我们可以先找到它的 $J or d an$ 标准形 $J$ ，再去寻找某个可逆矩阵 $P$ 使得 $P^{-1}AP=J$ ，改写一下就是
$A=PJP^{-1}\tag{5}$ 此即 $J or d an$ 分解。

讲到这里我还想补充一点，前面我们提到 $J or d an$ 块进行第③种变化(做转置)时其特征矩阵的初等因子并没有发生改变，仍然可以视为我们所需要的那个 $J or d an$ 块。如果所有的 $J or d an$ 块都进行转置，其实相当于把 $A$ 的 $J or d an$ 标准形 $J$ 进行转置得到 $J^{T}$ ，它们的特征矩阵 $\lambda I-J$ 和 $\lambda I-J^{T}$ 具有完全一致的初等因子 $\Rightarrow$ $\lambda I-J$ 和 $\lambda I-J^{T}$ 相抵 $\Rightarrow$ 对应的数字矩阵 $J$ 和 $J^{T}$ 相似。根据矩阵相似的传递性，我们有
$A\sim J\sim J^{T}\tag{6}$ 同时，我们对式 $(5)$ 两边同取转置得
$A^{T}=(P^{T})^{-1}J^{T}P^{T}\tag{7}$ 则有
$A^{T}\sim J^{T}\tag{8}$ 结合式 $(6)$ 和式 $(8)$ 我们得到
$A\sim J\sim J^{T}\sim A^{T}\tag{9}$ 没错，我最后想补充的一点就是 $A$ 相似于 $A^{T}$ ，它们具有相同的 $J or d an$ 标准形！