矩阵乘操作、三角化、开方特征值 —— Umeyama 算法推导的数学准备 (III)

本文链接：https://blog.csdn.net/woyaomaishu2/article/details/134300251

Title: 矩阵乘操作、三角化、开方特征值 —— Umeyama 算法推导的数学准备 (III)

文章目录

前言
I. 矩阵乘的操作
II. 上三角化
III. 矩阵开平放的特征值
参考文献

前言

本篇博客梳理一下如下三个概念

[1] 矩阵乘的操作

[2] 矩阵的上三角化

[3] 已知平方矩阵的特征值求原矩阵的特征值

主要目标是为了明确第三个概念, 作为点云配准的奇异值算法 (Umeyama 算法) 推导的一个数学基础.

当然这些基本的数学概念在教科书中都能找到^[1], 写出来让自己理解更透彻一点.

I. 矩阵乘的操作

矩阵乘的列操作

假设矩阵 $\mathbf{A}$ 和矩阵 $\mathbf{P}$ 是两个 $n$ 阶矩阵 (方阵). 矩阵 $\mathbf{P}$ 写成列向量形式为 $\mathbf{P}=\begin{bmatrix}\mathbf{p}_1,\ldots, \mathbf{p}_n\end{bmatrix}$ . 矩阵乘可以写成
$\mathbf{A}\mathbf{P} = \begin{bmatrix}\mathbf{A}\mathbf{p}_1 &\cdots & \mathbf{A}\mathbf{p}_n\end{bmatrix} \tag{I-1}$
如果矩阵 $\mathbf{A}$ 是对角矩阵, 则
$\mathbf{P}\begin{bmatrix}a_1 && \\ & \ddots &\\ &&a_n\end{bmatrix} = \begin{bmatrix}a_1 \mathbf{p}_1 &\cdots & a_n \mathbf{p}_n \end{bmatrix}$

矩阵乘的行操作

假设矩阵 $\mathbf{A}$ 和矩阵 $\mathbf{P}$ 是两个 $n$ 阶矩阵 (方阵). 矩阵 $\mathbf{P}$ 写成行向量形式为 $\mathbf{P}=\begin{bmatrix}\mathbf{p}_1\\ \vdots\\ \mathbf{p}_n\end{bmatrix}$ . 矩阵乘可以写成
$\mathbf{P} \mathbf{A} = \begin{bmatrix}\mathbf{p}_1 \mathbf{A} \\ \vdots \\ \mathbf{p}_n \mathbf{A}\end{bmatrix} \tag{I-1}$
如果矩阵 $\mathbf{A}$ 是对角矩阵, 则
$\begin{bmatrix}a_1 && \\ & \ddots &\\ &&a_n\end{bmatrix} \mathbf{P} = \begin{bmatrix}a_1 \mathbf{p}_1 \\ \vdots \\ a_n \mathbf{p}_n \end{bmatrix}$

II. 上三角化

任何 $n$ 阶矩阵 (方阵) 相似于一个上三角矩阵.

Proof^[1]

利用归纳法证明.

如果 $n = 1$ , 本身就是上三角矩阵, 结论成立.

假设 $n - 1$ 时结论成立, 即任何 $n - 1$ 阶矩阵相似于一个上三角矩阵.

如何推得 $n$ 阶矩阵也成立？

假设 $\mathbf{x}_1, \mathbf{x}_2, \ldots, \mathbf{x}_n$ 是独立无关的列向量, 其中 $\mathbf{x}_1$ 是矩阵 $\mathbf{A}$ 对应于特征值 $\lambda_1$ 的特征向量. 注意除了 $\mathbf{x}_1$ 以外其他列向量没有被要求是 $\mathbf{A}$ 的特征向量.

定义
$\mathbf{P}_1 \triangleq \begin{bmatrix} \mathbf{x}_1 & \mathbf{x}_2 & \ldots & \mathbf{x}_n \end{bmatrix} \tag{II-1}$
则根据上一节矩阵乘的操作有
$\mathbf{A}\mathbf{P}_1 = \begin{bmatrix} \mathbf{A} \mathbf{x}_1 & \mathbf{A} \mathbf{x}_2 &\cdots & \mathbf{A} \mathbf{x}_n \end{bmatrix} = \begin{bmatrix} \lambda_1 \mathbf{x}_1 & \mathbf{A} \mathbf{x}_2 &\cdots & \mathbf{A} \mathbf{x}_n \end{bmatrix} \tag{II-2}$
又因为逆矩阵的性质
$\begin{aligned} \mathbf{P}_1^{-1} \mathbf{P}_1 & = \mathbf{P}_1^{-1} \begin{bmatrix} \mathbf{x}_1 & \mathbf{x}_2 & \ldots & \mathbf{x}_n \end{bmatrix}\\ & = \begin{bmatrix} \mathbf{P}_1^{-1} \mathbf{x}_1 & \mathbf{P}_1^{-1} \mathbf{x}_2 & \ldots & \mathbf{P}_1^{-1} \mathbf{x}_n \end{bmatrix}\\ &=\begin{bmatrix}1 && \\ &\ddots &\\ &&1\end{bmatrix} \end{aligned} \tag{II-3}$
可以知道 $\mathbf{P}_1^{-1} \mathbf{x}_1 = \begin{bmatrix}1\\0\\ \vdots\\ 0\end{bmatrix}$ 及 $\mathbf{P}_1^{-1} \lambda_1 \mathbf{x}_1 = \begin{bmatrix}\lambda_1\\0\\ \vdots\\ 0\end{bmatrix}$ .

故有
$\begin{aligned} \mathbf{P}_1^{-1} \mathbf{A} \mathbf{P}_1 &= \mathbf{P}_1^{-1} \begin{bmatrix} \lambda_1 \mathbf{x}_1 & \mathbf{A} \mathbf{x}_2 &\cdots & \mathbf{A} \mathbf{x}_n \end{bmatrix} \\ &= \begin{bmatrix} \mathbf{P}_1^{-1} \lambda_1 \mathbf{x}_1 & \mathbf{P}_1^{-1} \mathbf{A} \mathbf{x}_2 &\cdots & \mathbf{P}_1^{-1} \mathbf{A} \mathbf{x}_n \end{bmatrix} \\ &= \left[\begin{array}{c:c} \lambda_1 & \begin{array}{ccc} b_{12} & \cdots & b_{1n}\end{array}\\ \hdashline \begin{array}{c} 0\\ \vdots\\ 0 \end{array} & \mathbf{A}_1 \end{array}\right] \end{aligned} \tag{II-4}$
由归纳法对 $n - 1$ 情况的假设可知, 存在 $n - 1$ 阶方阵 $\mathbf{Q}$ 使得
$\mathbf{Q}^{-1} \mathbf{A}_1 \mathbf{Q} = \begin{bmatrix} \lambda_2 &&\ast \\ &\ddots & \\ &&\lambda_n\end{bmatrix} \tag{II-5}$
令
$\mathbf{P}_2 \triangleq \left[\begin{array}{c:c} 1 & \begin{array}{ccc} 0 & \cdots & 0\end{array}\\ \hdashline \begin{array}{c} 0\\ \vdots\\ 0 \end{array} & \mathbf{Q} \end{array}\right] \tag{II-6}$
则其逆为
$\mathbf{P}_2^{-1} \triangleq \left[\begin{array}{c:c} 1 & \begin{array}{ccc} 0 & \cdots & 0\end{array}\\ \hdashline \begin{array}{c} 0\\ \vdots\\ 0 \end{array} & \mathbf{Q}^{-1} \end{array}\right] \tag{II-7}$
同时令
$\mathbf{P} \triangleq \mathbf{P}_1 \mathbf{P}_2 \tag{II-8}$
计算
$\begin{aligned} \mathbf{P}^{-1} \mathbf{A} \mathbf{P} & = (\mathbf{P}_1 \mathbf{P}_2)^{-1} \mathbf{A} (\mathbf{P}_1 \mathbf{P}_2) = \mathbf{P}_2^{-1} (\mathbf{P}_1^{-1} \mathbf{A} \mathbf{P}_1) \mathbf{P}_2\\ {\small \text{(II-4)}} \quad & = \mathbf{P}_2^{-1} \left[\begin{array}{c:c} \lambda_1 & \begin{array}{ccc} b_{12} & \cdots & b_{1n}\end{array}\\ \hdashline \begin{array}{c} 0\\ \vdots\\ 0 \end{array} & \mathbf{A}_1 \end{array}\right] \mathbf{P}_2\\ {\small \text{(II-6),(II-7)}} \quad &= \left[\begin{array}{c:c} 1 & \begin{array}{ccc} 0 & \cdots & 0\end{array}\\ \hdashline \begin{array}{c} 0\\ \vdots\\ 0 \end{array} & \mathbf{Q}^{-1} \end{array}\right] \left[\begin{array}{c:c} \lambda_1 & \begin{array}{ccc} b_{12} & \cdots & b_{1n}\end{array}\\ \hdashline \begin{array}{c} 0\\ \vdots\\ 0 \end{array} & \mathbf{A}_1 \end{array}\right] \left[\begin{array}{c:c} 1 & \begin{array}{ccc} 0 & \cdots & 0\end{array}\\ \hdashline \begin{array}{c} 0\\ \vdots\\ 0 \end{array} & \mathbf{Q} \end{array}\right]\\ &= \left[\begin{array}{c:c} \lambda_1 & \begin{array}{ccc} 0 & \cdots & 0\end{array}\\ \hdashline \begin{array}{c} 0\\ \vdots\\ 0 \end{array} &\mathbf{Q}^{-1} \mathbf{A}_1 \mathbf{Q} \end{array}\right]\\ {\small \text{(II-5)}}\quad &=\left[ \begin{array}{c:c} \lambda_1\\ \hdashline &\begin{matrix} \lambda_2 &&\ast \\ &\ddots & \\ &&\lambda_n\end{matrix} \end{array}\right] \end{aligned} \tag{II-9}$
这样推导得到归纳法的 $n$ 阶矩阵情况也成立.

证明完毕.

III. 矩阵开平放的特征值

假设 $\mathbf{A}$ 是一个复矩阵. $\lambda$ 是 $\mathbf{A}^2$ 的特征值. 则可证明 $\sqrt{\lambda}$ 或者 $-\sqrt{\lambda}$ 是 $\mathbf{A}$ 的特征值.

Proof^[1]

根据上一小节以证明的定理 “任何 $n$ 阶矩阵 (方阵) 相似于一个上三角矩阵”, 假设矩阵 $\mathbf{A}$ 相似于上三角矩阵 $\mathbf{B}$ , 即
$\mathbf{P}^{-1} \mathbf{A} \mathbf{P} = \mathbf{B} \triangleq \begin{bmatrix} b_{11} &&\ast\\ &\ddots &\\ &&b_{nn}\end{bmatrix} \tag{III-1}$
那么
$\mathbf{P}^{-1} {\mathbf{A}^{2}} \mathbf{P} = \mathbf{B}^2 \triangleq \begin{bmatrix} b_{11}^2 &&\ast\\ &\ddots &\\ &&b_{nn}^2\end{bmatrix} \tag{III-2}$
说明这种情况下 $\mathbf{A}^2$ 与 $\mathbf{B}^2$ 也相似.
如下算式说明相似矩阵的特征方程是一致的.
$\begin{aligned} \left|\mathbf{P}^{-1} {\mathbf{A}^{2}} \mathbf{P} - \lambda \mathbf{I} \right| & = \left|\mathbf{P}^{-1}\right| \cdot \left| {\mathbf{A}^{2}} - \lambda \mathbf{I} \right| \cdot\left| \mathbf{P}\right|\\ & = \left|\mathbf{P}^{-1}\right| \cdot\left| \mathbf{P}\right| \cdot \left| {\mathbf{A}^{2}} - \lambda \mathbf{I} \right|\\ & = \left|\mathbf{P}^{-1} \mathbf{P}\right| \cdot \left| {\mathbf{A}^{2}} - \lambda \mathbf{I} \right|\\ & = \left| {\mathbf{A}^{2}} - \lambda \mathbf{I} \right| \end{aligned} \tag{III-3}$
特征方程的根就是特征值, 因为 $\mathbf{P}^{-1} {\mathbf{A}^{2}} \mathbf{P}$ 与 $\mathbf{A}^{2}$ 特征方程一致, 故特征值也一样. 也就是相似矩阵的特征值一致.

因为 $\lambda$ 是 $\mathbf{A}^2$ 的特征值, 故也是 $\mathbf{B}^2$ 的特征值. 则 $\lambda$ 必为上三角矩阵 $\mathbf{B}^2$ 的对角线上的元素之一, 如
$\lambda = b_{kk}^2$
那么 $\mathbf{A}$ 的特征值 (也就是 $\mathbf{B}$ 的特征值)
$b_{kk} = \sqrt{\lambda} \quad \text{or} \quad b_{kk} = -\sqrt{\lambda}$
证明完毕.