Hermite矩阵的特征值变分性质

weixin_52382484

已于 2023-06-08 12:17:42 修改

阅读量771

点赞数 2

文章标签：矩阵线性代数

于 2023-06-08 11:33:37 首次发布

本文链接：https://blog.csdn.net/weixin_52382484/article/details/130378498

版权

courant–friedrich极小极大定理

矩阵A是一个Hermite矩阵，其特征值 $\lambda_1\le \lambda_2\dots\le \lambda_n$

有 $\lambda_i=\min_{\dim V=i,V\in C^n} \quad \max_{x\in V ,||x||_{2}=1} x^HAx$

$\lambda_i = \max_{\dim V=n-i+1,V\in C^n}\quad \min_{x\in V,||x||_2=1}x^HAx$

Proof:

首先假设A的特征值对应的单位正交特征向量是 $u_1,\dots,u_n$ 。
对于i维空间V， $\dim V\cap span \{u_i,\dots,u_n\} = \dim V+\dim span\{u_i,\dots,u_n\}-\dim V\cup span \{u_i,\dots,u_n\}\ge i+n-i+1-n=1$ 。

所以假设 $x\in V\cap span \{u_i,\dots,u_n\}, x=\sum_{k=i}^na_ku_k,||x||_2=1$ 。

$x^HAx=x^H\sum_{k=i}^na_k\lambda_ku_k=\sum_{k=i}^na_k^2\lambda_k\ge \lambda_i$

所以
$\max_{x\in V ,||x||_{2}=1} x^HAx\ge \lambda_i$

$\min_{\dim V=i} \max_{x\in V ,||x||_{2}=1} x^HAx\ge \lambda_i$

当 $\{u_1,\dots,u_i\}$ 时候可以取得等号。从而 $\lambda_i=\min_{\dim V=i,V\in C^n} \quad \max_{x\in V ,||x||_{2}=1} x^HAx$

Weyl不等式

形式一

$\lambda_i(A)+\lambda_1(B)\le \lambda_i(A+B)\le \lambda_i(A)+\lambda_n(B)$

$\lambda_1(B)\le \lambda_i(A+B)-\lambda_i(A)\le \lambda_n(B)$

Proof:

根据courant–friedrich极小极大定理
$\begin{aligned}&\lambda_i(A+B)=\min_{\dim V=i,V\in C^{n}} \quad \max_{x\in V} \frac{x^H(A+B)x}{x^Hx}\\&\le \min_{\dim V=i,V\in C^{n}} \quad \bigg(\max_{x\in V} \frac{x^HAx}{x^Hx}+\max_{x\in V} \frac{x^HBx}{x^Hx}\bigg)\le \lambda_{i}(A)+\lambda_n(B)\end{aligned}$

同理可证。

形式二

注意到 $||A||_2=\max_{i=1\dots,n} |\lambda_i(A)|$

$\max_{i=1,\dots,n}|\lambda_i(A+B)-\lambda_i(A)|\le ||B||_2$

形式三

若B是半正定，那么 $\lambda_1(B)=0$

$\lambda_i(A)\le \lambda_i(A+B)$

Hoffman–Wielandt不等式

$\sum_{i=1}^n(\lambda_i(A)-\lambda_i(B))^2\le ||A-B||_F^2$

Cauchy交错定理

形式一

如果C是A的n-1阶主子式，那么
$\lambda_i(A)\le\lambda_i(C)\le\lambda_{i+1}(A),i=1,\dots,n-1$

推论

若 $\lambda$ 是A的m重特征值，那么 $\lambda$ 至少是C的m-1重特征值。

形式二

如果C是A的n-k阶主子式，那么
$\lambda_i(A)\le\lambda_i(C)\le\lambda_{i+k}(A),i=1,\dots,n-k$

形式三

存在 $X\in C^{n\times m},X^HX=I_m,n\ge m$ ，那么
$\lambda_i(A)\le\lambda_i(X^HAX)\le\lambda_{i+n-m}(A),i=1,\dots,m$

Proof:

根据courant–friedrich极小极大定理
$\begin{aligned}&\lambda_i(X^HAX)=\min_{\dim V=i,V\in C^{m}} \quad \max_{x\in V} \frac{x^HX^HAXx}{x^Hx}=\min_{\dim V=i,V\in C^{m}} \quad \max_{x\in V} \frac{x^HX^HAXx}{(Xx)^HXx}\\&=\min_{\dim V=i,V\in C^{m},W=XV} \quad \max_{y=Xx\in W} \frac{y^HAy}{y^Hy}\ge \min_{\dim W=i,W\in C^{n}} \quad \max_{y=Xx\in W} \frac{y^HAy}{y^Hy}=\lambda_i(A)\end{aligned}$

最后一个不等式成立是因为W=XV这个子空间变换虽然不改变子空间维数，但是并不是从m维复空间到n维复空间的满射。比如 $X=\begin{pmatrix}I_m\\0_{n-m,m}\end{pmatrix}$ , $W=XV=\begin{pmatrix}V\\0_{n-m,m}\end{pmatrix}$ 并不能代表整个n维复空间。左边min函数的约束强，所以成立不等式。

同样的，

$\begin{aligned}&\lambda_i(X^HAX)=\max_{\dim V=m-i+1,V\in C^{m}} \quad \min_{x\in V} \frac{x^HX^HAXx}{x^Hx}=\max_{\dim V=m-i+1,V\in C^{m}} \quad \min_{x\in V} \frac{x^HX^HAXx}{(Xx)^HXx}\\&=\max_{\dim V=m-i+1,V\in C^{m},W=XV} \quad \min_{y=Xx\in W} \frac{y^HAy}{y^Hy}\le \max_{\dim W=m-i+1,W\in C^{n}} \quad \min_{y=Xx\in W} \frac{y^HAy}{y^Hy}=\lambda_{n-m+i}(A)\end{aligned}$