实对称矩阵一定可以对角化

最新推荐文章于 2023-05-23 18:51:20 发布

luixiao1220

最新推荐文章于 2023-05-23 18:51:20 发布

阅读量3.5w

点赞数 28

分类专栏：高等代数

本文链接：https://blog.csdn.net/luixiao1220/article/details/106994962

版权

高等代数专栏收录该内容

8 篇文章 3 订阅

订阅专栏

UTF8gbsn

实对称矩阵一定可以对角化.
最近看共轭梯度下降的时候看到有人的推导里面用到了这个命题. 虽然以前学过,
但是学得很渣, 所以没有自己想过这个命题怎么样成立的.
现在将这些证明过程梳理一下.

实对称矩阵含有n个实根

首先我们来证明一个命题, 实对称矩阵含有n个实根,
注意,n个实根并不一定都是不同的, 可能含有重根.
比如 $r-1)^2=0$ 就含有两个重根 $r = 1$ .在计算根数目的时候这个方程的解算两个.

首先, 任意的矩阵 $\mathbf{A}$ ,它的特征多项式
$|\mathbf{A}-\lambda\mathbf{I}|=0$
是一个 $n$ 次多项式(这是很显然的).
由于 $n$ 次多项式必定有 $n$ 个根(在复数域上). 这个命题暂不证明,
直接使用. 我写过另外一篇文章简要的证明了一下这个定理.
有了上一步的结论,
我们现在只需要证明每一个根 $\lambda_i$ 是实根就可以了.
这个证明过程很简单. 假设 $\lambda_i$ 是任意根之一,
并且 $\mathbf{\alpha}_i$ (当然也是在复数域),
那么根据特征值和特征向量的定义.我们可以得
$\mathbf{A}\mathbf{\alpha}_i=\lambda_i\mathbf{\alpha}_i$ 取共轭得
$\mathbf{A}\mathbf{\overline{\alpha}}_i=\overline{\lambda}_i\mathbf{\overline{\alpha}}_i$
再进行转置得, 注意 $A^T=A$ , 对称矩阵.
$\mathbf{\overline{\alpha}}_i^T\mathbf{A}=\overline{\lambda}_i\mathbf{\overline{\alpha}}_i^T$
右边乘 $\mathbf{\alpha}_i$ 得
$\mathbf{\overline{\alpha}}_i^T\mathbf{A}\mathbf{\alpha}_i=\overline{\lambda}_i\mathbf{\overline{\alpha}}_i^T\mathbf{\alpha}_i$

再看 $\mathbf{A}\mathbf{\alpha}_i=\lambda_i\mathbf{\alpha}_i$ ,
对它左边乘 $\overline{\mathbf{\alpha}}_i^{T}$ 可得
$\mathbf{\overline{\alpha}}_i^T\mathbf{A}\mathbf{\alpha}_i=\lambda_i\mathbf{\overline{\alpha}}_i^T\mathbf{\alpha}_i$
上面两个式子相减得
$0=(\mathbf{\overline{\lambda}_i-\lambda_i})\mathbf{\overline{\alpha}}_i^T\mathbf{\alpha}_i$
因为, $\mathbf{\overline{\alpha}}_i^T\mathbf{\alpha}_i$ 是非0向量.所以我们可得 $\overline{\lambda}_i-\lambda_i=0$ .
也就是说 $\lambda_i$ 是实数.
又因为 $\lambda_i$ 是任意的特征值,所以 $\mathbf{A}$ ,
的所有特征值都是实数.

实对称矩阵属于不同特征值的特征向量正交

接下来我们再来证明一个命题,实对称矩阵属于不同特征值的特征向量正交.我们先假设两个不同的特征值位 $\lambda_i,\lambda_j$ ,
他们对应的特征向量为 $\mathbf{\alpha}_i, \mathbf{\alpha}_j$ . 假如,
我们定义 $(\mathbf{\alpha}_i, \mathbf{\alpha}_j)$ 表示点积.
那么我们可以按照下面的推导.

$\lambda_i(\mathbf{\alpha}_i, \mathbf{\alpha}_j)=(\lambda_i\mathbf{\alpha}_i, \mathbf{\alpha}_j)=(\mathbf{A\alpha}_i, \mathbf{\alpha}_j)=\mathbf{\alpha_j^TA\alpha_i}=\mathbf{\alpha_i^TA\alpha_j}$
$\lambda_j(\mathbf{\alpha}_i, \mathbf{\alpha}_j)=(\mathbf{\alpha}_i, \lambda_j\mathbf{\alpha}_j)=(\mathbf{\alpha}_i, \mathbf{A\alpha}_j)=\mathbf{\alpha_i^TA\alpha_j}$

下相减得 $(\lambda_i-\lambda_j)(\mathbf{\alpha}_i, \mathbf{\alpha}_j)=0$ ,
又因为 $\lambda_i\neq \lambda_j \Rightarrow \mathbf{\alpha}_i^T\cdot \mathbf{\alpha}_j=0$ ,
也就是正交成立.

实对称矩阵可对角化

这里我们使用归纳法来证明.

首先假设 $n = 1$ . $\mathbf{A}=a_{11}$ . 这个不证自明.
假设 $n = k - 1$ , 命题撤成立.
现在 $n = k$ , 我们假设其中一个特征值位 $\lambda_1$ ,
那么我可以利用第一个特征值对应的特征向量构造一组 $R^n$ 的正交基.
$T=(\eta_1, \eta_2,\cdots, \eta_n)$ . 那么我们可以得
$T^{-1}AT=(T^{-1}\lambda_1\eta_1, T^{-1}A\eta_2, \cdots, T^{-1}A\eta_n)$
又因为 $T^{-1}T=I$ , 那么,
我们可以得 $T^{-1}\eta_1=\mathbf{\varepsilon}_1$ . 那么可得
$T^{-1}AT=\left( \begin{array}{cc} \lambda_1 & \mathbf{\alpha} \\ \mathbf{0} & \mathbf{B} \end{array} \right)$

由于 $A$ , 是一个实对称矩阵,
那么 $T^{-1}AT$ 也是一个实对称矩阵.进而 $\mathbf{\alpha}=\mathbf{0}$ .
由此可见 $B$ 也是一个 $(k-1)\times (k-1)$ 的实对称矩阵. 按照假设,
它是可以对角化的.现在假设.
$T_2^{-1}BT_{2}=diag\{\lambda_2, \lambda_3, \cdots, \lambda_n\}$
并设 $T_f=T\left( \begin{array}{cc} 1 & 0 \\ 0 & T_2 \end{array} \right)$ 那么 $T^{-1}_fAT_{f}=\left( \begin{array}{cc} 1 & 0 \\ 0 & T_2 \end{array} \right)^{-1}T^{-1}AT\left( \begin{array}{cc} 1 & 0 \\ 0 & T_2 \end{array} \right)=\left( \begin{array}{cc} 1 & 0 \\ 0 & T_2^{-1} \end{array} \right)\left( \begin{array}{cc} \lambda_1 & 0 \\ 0 & B \end{array} \right)\left( \begin{array}{cc} 1 & 0 \\ 0 & T_2 \end{array} \right)$ $=\left( \begin{array}{cc} \lambda_1& 0 \\ 0 & T_2^{-1}BT_{2} \end{array} \right)=diag\{\lambda_1,\lambda_2, \cdots, \lambda_n\}$