Schur 三角化定理的推论

将学习到什么

从 Schur 的酉三角化定理可以收获一批结果,在这一部分介绍重要的几个.

 


迹与行列式

相似矩阵具有相同的特征多项式, 从特征多项式一节中, 我们又知道,相似矩阵的迹以及行列式都是相同的,且分别用所有特征值的和与积表示,所以对于矩阵 \(A\in M_n\), \(\mathrm{tr}\,A\)\(\mathrm{det}\,A\) 都可以用任何与 \(A\) 相似矩阵来计算,酉三角化中的上三角矩阵 \(T\) 的主对角线元素就是矩阵 \(A\) 的特征值,所以计算非常方便。

 

\(A\) 的多项式的特征值

假设 \(A\in M_n\) 有特征值 \(\lambda_1,\cdots\,\lambda_n\), 并设 \(p(t)\) 是一个给定的多项式,从特征值的特征向量的定理 1.1 知:对每一个 \(i=1,\cdots,n\), \(p(\lambda_i)\) 都是 \(p(A)\) 的特征值,又如果 \(\mu\)\(p(A)\) 的特征值,那么就存在某个 \(i\in \{1,\cdots,n\}\), 使得 \(\mu=p(\lambda_i)\). 这些结论给出了 \(p(A)\) 的特征值,但没有给出它们的重数,Schur 定理揭示出它们的重数.

\(A=UTU^*\), 其中 \(U\) 是酉矩阵,而 \(T=[t_{ij}]\) 是上三角矩阵,其主对角元素是 \(t_{11}=\lambda_1,t_{22}=\lambda_2,\cdots,t_{nn}=\lambda_n\). 这样就有 \(p(A)=p(UTU^*)=Up(T)U^*\), \(p(T)\) 的主对角元素是 \(p(\lambda_1),p(\lambda_2),\cdots,p(\lambda_n)\), 故而由矩阵 \(T\) 的对角元素算出 \(p(T)\) 的特征值重数. 特别地,对每个 \(k=1,\cdots\), 矩阵 \(A^k\) 的特征值是 \(\lambda_1^k,\cdots,\lambda_n^k\), 且
\begin{align}
\mathrm{tr}\, A^k=\lambda_1^k+\cdots+\lambda_n^k
\end{align}
假设 \(A\in M_n\), 如果对某个正整数 \(k\)\(A^k=0\), 那么 \(\sigma(A)=\{0\}\), 所以 \(A\) 的特征多项式是 \(p_A(t)=t^n\), 其逆命题也成立,即如果 \(\sigma(A)=\{0\}\), 那么存在一个酉矩阵 \(U\) 以及一个严格上三角矩阵 \(T\), 使得 \(A=UTU^*\), 于是如下结论等价:\(A\) 是幂零的\(\Leftrightarrow A^n=0 \Leftrightarrow \sigma(A)=\{0\}\).

 

Cayley-Hamilton 定理

这个定理是说:\(p_A(t)\)\(A\) 的特征多项式,那么 \(p_A(A)=0\).
通过多项式分解和酉相似,利用归纳法可以证明. 这个定理常常被解释成每个方阵都满足它自己的特征方程,不过这需要仔细加以理解:纯量多项式 \(p_A(t)\) 首先是作为 \(p_A(t)=\mathrm{det}\, (tI-A)\) 计算的,然后才是通过代换 \(t \rightarrow A\) 来计算矩阵 \(p_A(A)\).
Cayley-Hamilton 定理的一项重要用途是将 \(A\in M_n\) 的幂 \(A^k\) (对 \(k \geqslant n\))写成 \(I,A,A^2,\cdots,A^{n-1}\) 的线性组合. 比如 \(A=\begin{bmatrix} 3 & 1 \\ -2 & 0 \end{bmatrix}\). 那么 \(p_A(t)=t^2-3t+2\), 所以 \(A^2-3A+2I=0\), 从而 \(A^2=3A-2I\),\(A^3=(3A-2I)A=3A^2-2A=3(3A-2I)-2A=7A-6I\), 类似可计算 \(A^4,A^5,\cdots\) 等等. 还可以将非奇异矩阵 \(A\) 的负次数幂表示成 \(A\)\(I\) 的线性组合,将 \(A^2-3A+2I=0\) 写成 \(I=A\Big[ \dfrac 12 (-A+3I) \Big]\), 从而 \(A^{-1}=-\dfrac 12 A+\dfrac 32 I\),同样可写出 \(A^{-2},A^{-3}\) 等等.

 

关于线性矩阵方程的 Sylvester 定理

与交换性有关的方程 \(AX-XA=0\) 是线性矩阵方程 \(AX-XB=C\) 的一个特例,通常称为Sylvester 方程.
1255644-20171105121810795-1749552976.png
这个定理不证明了,要了解定理中的那个充分必要条件.

 

Schur 三角化定理中的唯一性

对给定和 \(A \in M_n\)酉三角化 中定理 1.1 描述的那种可以通过酉相似得到的上三角型 \(T\) 不一定是唯一的. 也就是说,有相同主对角线的不同的上三角矩阵可能是酉相似的.
如果 \(T,T' \in M_n\) 是上三角的,且有相同的主对角线,主对角线上相同的元素归并在一起,关于使得 \(T'=WTW^*\) (也就是 \(WT=T'W\))成立的酉矩阵 \(W \in M_n\), 有什么特点?下面的定理说的是:\(W\) 必定是分块对角的,而且在关于 \(T\) 的超对角元素的某种假设之下,\(W\) 必定是对角矩阵,甚至是一个纯量矩阵,在后一种情形有 \(T=T'\).
1255644-20171105152316638-1698571234.png

 

每一个方阵都可以分块对角化

1255644-20171105154429529-1728361324.png
  证明:\(T\) 分划成
\begin{align}
T=\begin{bmatrix} T_{11} & Y \\ 0 & S_2 \end{bmatrix} \notag
\end{align}
其中 \(S_2=[T_{ij}]_{i,j=2}^d\). 注意 \(T_{11}\) 的仅有的特征值是 \(\lambda_1\), 而 \(S_2\) 的特征值是 \(\lambda_2,\cdots,\lambda_n\). Sylvester 定理保证了方程 \(T_{11}X-XS=-Y\) 有一个解 \(X\),用它来构造
\begin{align}
M=\begin{bmatrix} I_{n_1} & X \\ 0 & I \end{bmatrix} \qquad \text{以及其逆} \qquad M^{-1}=\begin{bmatrix} I_{n_1} & -X \\ 0 & I \end{bmatrix}\notag
\end{align}
那么
\begin{align}
M^{-1}TM=\begin{bmatrix} I_{n_1} & -X \\ 0 & I \end{bmatrix} \begin{bmatrix} T_{11} & Y \\ 0 & S_2 \end{bmatrix} \begin{bmatrix} I_{n_1} & X \\ 0 & I \end{bmatrix}=\begin{bmatrix} T_{11} & T_{11}X-XS_2+Y \\ 0 & S_2 \end{bmatrix} = \begin{bmatrix} T_{11} & 0 \\ 0 & S_2 \end{bmatrix} \notag
\end{align}
如果 \(d=2\), 这就是所要的分块对角化. 如果 \(d>2\), 重复这一化简过程来证明 \(S_2\)\(T_{22}\oplus S_3\) 相似,其中 \(S_3=[T_{ij}]_{i,j=3}^d\). 经过 \(d-1\) 次化简,我们就得知 \(T\) 相似于 \(T_{11}\oplus \cdots\oplus T_{dd}\).
如果 \(A\) 是实的且有实特征值,那么它与一个刚刚考虑过的实的分块上三角矩阵实正交相似,每一步的化简都可以用实相似来实现.

 

秩 1 摄动的特征值

1255644-20171105161125826-159653689.png
  证明:\(\xi = x/ \lVert x \rVert _2\), 并令 \(U=[\xi \quad u_2 \quad \cdots \quad u_n]\) 是酉矩阵. 那么由 Schur 定理知
\begin{align}
U^*AU=\begin{bmatrix} \lambda & \bigstar \\ 0 & A_1 \end{bmatrix} \notag
\end{align}
其中 \(A_1 \in M_{n-1}\) 有特征值 \(\lambda_2,\cdots,\lambda_n\). 又有
\begin{align}
U^*xv^*U=\begin{bmatrix} \xi^*x \\ u_2^*x \\ \vdots \\ u_n^*x \end{bmatrix} v^* U = \begin{bmatrix} \lVert x \rVert _2 \\0 \\ \vdots \\ 0 \end{bmatrix} \begin{bmatrix}v^*\xi & v^*u_2 & \cdots & v^*u_n \end{bmatrix}=\begin{bmatrix} \lVert x \rVert _2 v^*\xi & \bigstar \\ 0 & 0 \end{bmatrix} = \begin{bmatrix} v^*x & \bigstar \\ 0 & 0 \end{bmatrix} \notag
\end{align}
这样一来,
\begin{align}
U^*(A+xv^*)U= \begin{bmatrix}\lambda+ v^*x & \bigstar \\ 0 & A_1 \end{bmatrix} \notag
\end{align}
就有特征值 \(\lambda+v^*x,\lambda_2,\cdots,\lambda_n\).

 


应该知道什么

  • 酉三角化对于求矩阵的迹与行列式是方便的
  • \(A\) 的多项式的特征值可以通过酉相似容易辨别出来
  • 每个方阵都满足它自己的特征方程
  • 每一个方阵都可以分块对角化
  • 秩 1 摄动的特征值

转载于:https://www.cnblogs.com/zhoukui/p/7786648.html

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值