【矩阵论】特征值的估计(上下界和盖尔圆)

前言:为什么不直接求特征值而是去估计特征值?

当我们遇到的不是书本上的3阶或4阶矩阵,而是高阶矩阵时(如图像中的256×256),我们再使用特征方程 det ⁡ ( λ I − A ) = 0 \det(\lambda I -A)=0 det(λIA)=0来求特征值就非常困难。我们难以求解没有必要逐一计算每一个精确的特征值。因此,在实际工程计算上,面对高阶矩阵,我们常常通过计算特征值的范围来估计特征值,这个范围越小,所估计的特征值就越精确。以下,本文就特征值估计常用方法做以梳理,完整定理证明请参考西工大的《矩阵论》[1]。

思路:如何估计特征值?

我们知道,对于 n n n阶非奇异方阵,有 n n n个特征值。

  • 从粗粒度的思路出发,我们可以先确定整体特征值( λ 1 , . . . , λ n \lambda_1,...,\lambda_n λ1,...,λn)的上下界,对于复数域的矩阵,我们还需要分别考虑其特征值的实部虚部,这就像我们找犯罪嫌疑人需要先知道TA的性别、身高以及一些宽泛的特征从而对TA有个大致的定位。
  • 从细粒度的思路出发,我们可以更深入的确定每个特征值 λ i \lambda_i λi的范围,如果这些范围有重叠,比如两个嫌疑人有一些共同特征,那对我们来说也是件麻烦事,但我们可以通过相似矩阵具有相同特征值的特点设计对角阵按比例缩放每个特征值的范围

梳理以上的两个朴素的idea,我们可以得到如下解决方案

一、特征值的界

我们主要的目的是仅通过计算原矩阵中的每个元素即可得到特征值的上下界。

方法1计算特征值虚部的上界( M M M越小,虚部 Im ( λ ) \text{Im}(\lambda) Im(λ)越小)

A = ( a i j ) ∈ R n × n A=(a_{ij})\in \mathbb{R}^{n\times n} A=(aij)Rn×n,若 λ \lambda λ表示 A A A的任一特征值,则 λ \lambda λ的虚部 Im ( λ ) \text{Im}(\lambda) Im(λ)满足如下不等式
{ M = max ⁡ 1 ≤ i , s ≤ n 1 2 ∣ a i j − a j i ∣ ∣ Im ( λ ) ∣ ≤ M n ( n − 1 ) 2 (1.1) \begin{cases} M=\max_{1\le i,s\le n} \frac12 |a_{ij}-a_{ji}| \\ |\text{Im}(\lambda)|\le M \sqrt{\frac{n(n-1)}2} \end{cases} \tag{1.1} {M=max1i,sn21aijajiIm(λ)M2n(n1) (1.1)

方法2计算特征值、实部和虚部的上界(该法虚部估计误差比法1大)

A = ( a i j ) ∈ C n × n A=(a_{ij})\in \mathbb{C}^{n\times n} A=(aij)Cn×n,若 λ \lambda λ表示 A A A的任一特征值,则有

{ ∣ λ ∣ ≤ ∥ A ∥ m ∞ = n ⋅ max ⁡ i , j ∣ a i j ∣ ∣ Re ( λ ) ∣ ≤ 1 2 ∥ A + A H ∥ m ∞ ∣ Im ( λ ) ∣ ≤ 1 2 ∥ A − A H ∥ m ∞ (1.2) \begin{cases} |\lambda| \le \|A\|_{m_\infty}=n\cdot\max_{i,j}|a_{ij}| \\ |\text{Re}(\lambda)| \le \frac12 \|A+A^H\|_{m_\infty} \\ |\text{Im}(\lambda)| \le \frac12 \|A-A^H\|_{m_\infty} \\ \end{cases} \tag{1.2} λAm=nmaxi,jaijRe(λ)21A+AHmIm(λ)21AAHm(1.2)

方法3计算矩阵行列式( n n n个特征值乘积)的上下界(需满足严格对角占优)

【预备知识】:设 A = ( a i j ) ∈ C n × n , R r ( A ) = ∑ s = 1 , s ≠ r n ∣ a r s ∣ A=(a_{ij})\in \mathbb{C}^{n\times n},R_r(A)=\sum_{s=1,s\not=r}^n|a_{rs}| A=(aij)Cn×n,Rr(A)=s=1,s=rnars,若所有 ∣ a r r ∣ > R r |a_{rr}|>R_r arr>Rr,则称矩阵 A A A按行严格对角占优。若存在某 ∣ a r r ∣ ≥ R r |a_{rr}|\ge R_r arrRr且至少有一个 ∣ a r r ∣ > R r |a_{rr}|> R_r arr>Rr则成为按行(弱)对角占优。例如

A = [ 9 2 3 5 9 1 1 1 − 9 ]            B = [ 9 2 3 4 9 5 1 8 − 9 ] \begin{gathered} A=\begin{bmatrix} 9 & 2 & 3\\ 5 & 9 & 1\\ 1 & 1 & -9\\ \end{bmatrix} \end{gathered} \begin{gathered} \;\;\;\;\; B=\begin{bmatrix} 9 & 2 & 3\\ 4 & 9 & 5\\ 1 & 8 & -9\\ \end{bmatrix} \end{gathered} A=951291319B=941298359
则由于
{ 9 = ∣ a 11 ∣ > R 1 ( A ) = ∣ a 12 ∣ + ∣ a 13 ∣ = 5 9 = ∣ a 22 ∣ > R 2 ( A ) = ∣ a 21 ∣ + ∣ a 23 ∣ = 6 9 = ∣ a 33 ∣ > R 3 ( A ) = ∣ a 31 ∣ + ∣ a 32 ∣ = 2            { 9 = ∣ b 11 ∣ > R 1 ( B ) = 5 9 = ∣ b 22 ∣ ≥ R 2 ( B ) = 9 9 = ∣ b 33 ∣ ≥ R 3 ( B ) = 9 \begin{cases} 9=|a_{11}|> R_1(A)=|a_{12}|+|a_{13}|=5\\ 9=|a_{22}|> R_2(A)=|a_{21}|+|a_{23}|=6\\ 9=|a_{33}|> R_3(A)=|a_{31}|+|a_{32}|=2\\ \end{cases} \;\;\;\;\; \begin{cases} 9=|b_{11}|> R_1(B)=5\\ 9=|b_{22}|\ge R_2(B)=9\\ 9=|b_{33}|\ge R_3(B)=9\\ \end{cases} 9=a11>R1(A)=a12+a13=59=a22>R2(A)=a21+a23=69=a33>R3(A)=a31+a32=29=b11>R1(B)=59=b22R2(B)=99=b33R3(B)=9
可知矩阵 A A A按行严格对角占优,而矩阵 B B B按行(弱)对角占优
【定理】:设 A = ( a i j ) ∈ C n × n A=(a_{ij})\in \mathbb{C}^{n\times n} A=(aij)Cn×n,若 A A A按行严格对角占优,则有如下不等式

{ M r = ∣ a r r ∣ + ∑ s = r + 1 n ∣ a r s ∣ m r = ∣ a r r ∣ − ∑ s = r + 1 n ∣ a r s ∣ \begin{cases} M_r=|a_{rr}|+ \sum_{s=r+1}^n |a_{rs}|\\ m_r=|a_{rr}|- \sum_{s=r+1}^n |a_{rs}|\\ \end{cases} {Mr=arr+s=r+1narsmr=arrs=r+1nars

0 < ∏ r = 1 n m r ≤ ∣ det ⁡ A ∣ = ∏ r = 1 n λ r ( A ) ≤ ∏ r = 1 n M r (1.3) 0< \prod_{r=1}^n m_r \le |\det A| = \prod_{r=1}^n \lambda_r(A) \le \prod_{r=1}^n M_r \tag{1.3} 0<r=1nmrdetA=r=1nλr(A)r=1nMr(1.3)

方法4计算矩阵特征值模的平方和的上界( Schur \text{Schur} Schur不等式)

A = ( a i j ) ∈ C n × n A=(a_{ij})\in \mathbb{C}^{n\times n} A=(aij)Cn×n的特征值为 λ 1 , . . . , λ n \lambda_1,...,\lambda_n λ1,...,λn,则有如下不等式
∥ λ ∥ 2 2 = ∑ i = 1 n ∣ λ i ∣ 2 ≤ ∑ i = 1 n ∑ j = 1 n ∣ a i j ∣ 2 = ∥ A ∥ F 2 (1.4) \|\lambda\|_2^2 = \sum_{i=1}^n |\lambda_i|^2 \le \sum_{i=1}^n \sum_{j=1}^n |a_{ij}|^2=\|A\|_F^2 \tag{1.4} \\ λ22=i=1nλi2i=1nj=1naij2=AF2(1.4)

二、特征值的包含区域

此处主要通过 Gerschorin \text{Gerschorin} Gerschorin圆(盖尔圆)理论来划分特征值区域,盖尔圆的应用主要在于隔离特征值,该理论力求将每个特征值隔离到一个较小的范围内。

2.1 什么是 Gerschorin \text{Gerschorin} Gerschorin圆(盖尔圆)?

【定义】设 A = ( a i j ) ∈ C n × n A=(a_{ij})\in \mathbb{C}^{n\times n} A=(aij)Cn×n,则称矩阵 A A A的第 i i i Gerschorin \text{Gerschorin} Gerschorin圆(盖尔圆)是由如下不等式在复平面上确定的区域。
G i : ∣ z − a i i ∣ ≤ R i (2.1) G_i:|z-a_{ii}| \le R_i \tag{2.1} Gi:zaiiRi(2.1)
其中,如下称为盖尔圆 G i G_i Gi的半径
R i = R i ( A ) = ∑ j = 1 , j ≠ i n ∣ a i j ∣ R_i = R_i(A) = \sum_{j=1,j\not=i}^n |a_{ij}| Ri=Ri(A)=j=1,j=inaij

2.2 Gerschorin \text{Gerschorin} Gerschorin圆(盖尔圆)的主要性质有哪些?
  • 【性质1】矩阵 A = ( a i j ) ∈ C n × n A=(a_{ij})\in \mathbb{C}^{n\times n} A=(aij)Cn×n一切特征值都在它的 n n n个盖尔圆的并集之内。
  • 【性质2】在矩阵 A A A的所有盖尔圆组成的任一连通部分中,含有 A A A特征值的个数等于该连通部分的盖尔圆的个数。(连通区域:区域中的任一两点都可以用位于该区域内的一条折线连接起来)
  • 【性质3】设 A = ( a i j ) ∈ C n × n , B = ( a i j ) ∈ R n × n A=(a_{ij})\in \mathbb{C}^{n\times n},B=(a_{ij})\in \mathbb{R}^{n\times n} A=(aij)Cn×n,B=(aij)Rn×n,若 b i j ≥ ∣ a i j ∣    ( i , j = 1 , . . , n ) b_{ij}\ge |a_{ij}|\;(i,j=1,..,n) bijaij(i,j=1,..,n),则对 A A A的任一特征值 λ \lambda λ必有 i i i,使得 [ ρ ( B ) \rho(B) ρ(B)表示 B B B的谱半径]
    b i j ≥ ∣ a i j ∣ ⇒ ∣ λ − a i i ∣ ≤ ρ ( B ) − b i i b_{ij}\ge |a_{ij}| \Rightarrow |\lambda-a_{ii}| \le \rho(B)-b_{ii} bijaijλaiiρ(B)bii
  • 【性质4】设 A = ( a i j ) ∈ C n × n ( n ≥ 2 ) A=(a_{ij})\in \mathbb{C}^{n\times n}(n\ge2) A=(aij)Cn×n(n2),如果对于所有 i ≠ j i\not=j i=j,恒有
    ∣ a i i ∣ ∣ a j j ∣ > R i ( A ) R j ( A ) ⇔ det ⁡ A ≠ 0 |a_{ii}| |a_{jj}| > R_i(A)R_j(A) \Leftrightarrow \det A \not= 0 aiiajj>Ri(A)Rj(A)detA=0
2.3 放缩 Gerschorin \text{Gerschorin} Gerschorin圆(盖尔圆)的对角阵如何取?

由相似矩阵具有相同特征值的性质,常用如下关系放缩矩阵 A A A的特征值盖尔圆
B = D A D − 1 B=DAD^{-1} B=DAD1

对于对角阵 D D D的选取,我们常用如下准则

  • 放大 i i i个盖尔圆,则取 d i > 1 d_i>1 di>1,其余 d j = 1    ( j ≠ i ) d_j=1 \;(j\not= i) dj=1(j=i).
  • 缩小 i i i个盖尔圆,则取 d i < 1 d_i<1 di<1,其余 d j = 1    ( j ≠ i ) d_j=1 \;(j\not= i) dj=1(j=i).
  • 用来放缩的 d i ≠ 1 d_i\not=1 di=1,直接作用于 A A A的第 i i i的非主对角元素, 1 / d i 1/d_i 1/di作用于 A A A的第 i i i的非主对角元素.

当放缩第 i i i个盖尔圆的同时也会一定程度放缩其他盖尔圆,例如有如下矩阵 A A A
A = [ 20 3 1 2 10 2 8 1 0 ] \begin{gathered} A=\begin{bmatrix} 20 & 3 & 1\\ 2 & 10 & 2\\ 8 & 1 & 0\\ \end{bmatrix} \end{gathered} A=20283101120
分别取 D 1 D_1 D1 D 2 D_2 D2如下
D 1 = [ 2 1 1 ] D 2 = [ 1 1 1 2 ] \begin{gathered} D_1=\begin{bmatrix} 2 & & \\ & 1 & \\ & & 1\\ \end{bmatrix} \quad D_2=\begin{bmatrix} 1 & & \\ & 1 & \\ & & \frac12\\ \end{bmatrix} \end{gathered} D1=211D2=1121
B = D A D − 1 B=DAD^{-1} B=DAD1
B 1 = [ 20 6 2 1 10 2 4 1 0 ] B 2 = [ 20 6 2 2 10 4 4 0.5 0 ] \begin{gathered} B_1=\begin{bmatrix} 20 & \mathbf{6} &\mathbf{2} \\ \mathbf{1}& 10 & 2\\ \mathbf{4}& 1 & 0\\ \end{bmatrix} \quad B_2=\begin{bmatrix} 20 & 6 &\mathbf{2} \\ 2& 10 & \mathbf{4}\\ \mathbf{4}& \mathbf{0.5} & 0\\ \end{bmatrix} \end{gathered} B1=20146101220B2=20246100.5240
可见
行 : b i k = d i × a i k ( i ≠ k ) 列 : b k i = 1 d i × a k i ( i ≠ k ) 行:b_{ik} = d_i \times a_{ik} \quad (i\not = k) \\ 列:b_{ki} = \frac{1}{d_i} \times a_{ki} \quad (i\not = k) bik=di×aik(i=k)bki=di1×aki(i=k)

2.4 Gerschorin \text{Gerschorin} Gerschorin圆(盖尔圆)的应用(习题)
2.4.1 利用盖尔圆求每个特征值的范围
2.4.2 利用盖尔圆隔离范围重叠的特征值
2.4.3 利用盖尔圆性质3计算特征值范围

【问题】估计如下矩阵的特征值范围
A = [ 1 − 0.8 0.5 0 ] \begin{gathered} A=\begin{bmatrix} 1 & -0.8 \\ 0.5 & 0 \end{bmatrix} \end{gathered} A=[10.50.80]
【解】由性质3得
b i j ≥ ∣ a i j ∣ ⇒ ∣ λ − a i i ∣ ≤ ρ ( B ) − b i i b_{ij}\ge |a_{ij}| \Rightarrow |\lambda-a_{ii}| \le \rho(B)-b_{ii} bijaijλaiiρ(B)bii
因此构造一个满足比矩阵 A A A每个元素都大于等于的矩阵 B B B
B = [ 1 1 1 1 ] , 则 ∣ λ − 1 − 1 − 1 λ − 1 ∣ = ( λ − 1 ) 2 − 1 = λ ( λ − 2 ) \begin{gathered} B=\begin{bmatrix} 1 & 1 \\ 1 & 1 \end{bmatrix} ,\quad则 \begin{vmatrix} \lambda-1 & -1 \\ -1 & \lambda-1 \end{vmatrix}=(\lambda-1)^2-1=\lambda(\lambda-2) \end{gathered} B=[1111],λ111λ1=(λ1)21=λ(λ2)
λ 1 = 0 , λ 2 = 2 \lambda_1=0,\lambda_2=2 λ1=0,λ2=2,所以 ρ ( B ) = max ⁡ ( λ 1 , λ 2 ) = 2 \rho(B)=\max(\lambda_1,\lambda_2)=2 ρ(B)=max(λ1,λ2)=2,因此 A A A的特征值至少满足一下不等式之一
{ ∣ λ − 1 ∣ ≤ 2 − 1 = 1 ∣ λ − 0 ∣ ≤ 2 − 1 = 1 \begin{cases} |\lambda-1| \le 2-1=1\\ |\lambda-0| \le 2-1=1\\ \end{cases} {λ121=1λ021=1

2.4.4 利用盖尔圆性质4判别矩阵奇异性

∣ a i i ∣ ∣ a j j ∣ > R i ( A ) R j ( A ) ⇔ det ⁡ A ≠ 0 |a_{ii}| |a_{jj}| > R_i(A)R_j(A) \Leftrightarrow \det A \not= 0 aiiajj>Ri(A)Rj(A)detA=0

附录1:特征值的界—习题

例1-求特征值上界估计如下矩阵特征值的上界
A = ( 1 − 0.8 0.5 0 ) \begin{gathered} A= \begin{pmatrix} 1 & -0.8 \\ 0.5 & 0 \end{pmatrix} \end{gathered} A=(10.50.80)
解:①应用方法1
{ M = max ⁡ 1 2 ∣ 1.3 ∣ = 0.65 ∣ Im ( λ ) ∣ ≤ M n ( n − 1 ) 2 = 0.65 ⋅ 2 ( 2 − 1 ) 2 = 0.65 (1.1) \begin{cases} M=\max \frac12 |1.3|=0.65 \\ |\text{Im}(\lambda)|\le M \sqrt{\frac{n(n-1)}2} =0.65\cdot \sqrt{\frac{2(2-1)}2} =0.65 \end{cases} \tag{1.1} {M=max211.3=0.65Im(λ)M2n(n1) =0.6522(21) =0.65(1.1)
②应用方法2
{ ∣ λ ∣ ≤ ∥ A ∥ m ∞ = n ⋅ max ⁡ i , j ∣ a i j ∣ = 2 ⋅ 1 = 2 ∣ Re ( λ ) ∣ ≤ 1 2 ∥ A + A H ∥ m ∞ = 1 2 ( 2 ⋅ 2 ) = 2 ∣ Im ( λ ) ∣ ≤ 1 2 ∥ A − A H ∥ m ∞ = 1 2 ( 2 ⋅ 1.3 ) = 1.3 (1.2) \begin{cases} |\lambda| \le \|A\|_{m_\infty}=n\cdot\max_{i,j}|a_{ij}|=2\cdot1=2 \\ |\text{Re}(\lambda)| \le \frac12 \|A+A^H\|_{m_\infty}=\frac12 (2\cdot2)=2 \\ |\text{Im}(\lambda)| \le \frac12 \|A-A^H\|_{m_\infty} =\frac12 (2\cdot1.3)=1.3 \\ \end{cases} \tag{1.2} λAm=nmaxi,jaij=21=2Re(λ)21A+AHm=21(22)=2Im(λ)21AAHm=21(21.3)=1.3(1.2)
可见方法1在计算特征值虚部上界中比方法2更精准。

例2-求模最小特征值上界估计如下矩阵按模最小特征值的上界
A = ( 1 − 0.8 0.5 1 ) \begin{gathered} A= \begin{pmatrix} 1 & -0.8 \\ 0.5 & 1 \end{pmatrix} \end{gathered} A=(10.50.81)
解:分析该问题的矩阵,我们不难发现矩阵 A A A按行严格对角占优,因此可应用方法3快速求解
首先计算 M 1 = 1.8 , M 2 = 1 M_1=1.8,M_2=1 M1=1.8,M2=1,因此有
∏ r = 1 n λ r ( A ) ≤ ∏ r = 1 n M r = 1.8 ⇒ ( λ min ⁡ ) 2 ≤ λ 1 ⋅ λ 2 = 1.8 ⇒ λ min ⁡ ≤ 1.8 \begin{aligned} & \prod_{r=1}^n \lambda_r(A) \le \prod_{r=1}^n M_r =1.8\\ \Rightarrow & (\lambda_{\min})^2 \le \lambda_1\cdot \lambda_2=1.8\\ \Rightarrow & \lambda_{\min} \le \sqrt{1.8}\\ \end{aligned} r=1nλr(A)r=1nMr=1.8(λmin)2λ1λ2=1.8λmin1.8
而实际情况, ∣ λ 1 , 2 ∣ = 1.4 |\lambda_{1,2}|=\sqrt{1.4} λ1,2=1.4

例3-部分特征值上界已知如下矩阵的一个特征值 λ 1 = 2 \lambda_1=2 λ1=2,估计另外两个特征值的上界
A = ( 3 + i − 2 − 3 i 2 i 1 0 0 0 1 0 ) \begin{gathered} A= \begin{pmatrix} 3+i & -2-3i & 2i \\ 1 & 0 &0 \\ 0 & 1 & 0 \\ \end{pmatrix} \end{gathered} A=3+i1023i012i00
解:分析该问题的矩阵,我们发现矩阵 A A A并不是按行严格对角占优,因此无法方法3求解
,可用方法4求解,因此有
∑ i = 1 n ∣ λ i ∣ 2 = 4 + ∣ λ 2 ∣ 2 + ∣ λ 3 ∣ 2 ≤ ∑ i = 1 n ∑ j = 1 n ∣ a i j ∣ 2 = ∥ A ∥ F 2 = 9 + ∣ i 2 ∣ + 4 + ∣ 9 i 2 ∣ + ∣ 4 i 2 ∣ + 1 + 1 = 29 ⇒ ∣ λ 2 ∣ 2 + ∣ λ 3 ∣ 2 ≤ 25 ⇒ ∣ λ 1 , 2 ∣ ≤ 5 \begin{aligned} \sum_{i=1}^n |\lambda_i|^2 =4+ |\lambda_2|^2 + |\lambda_3|^2 & \le \sum_{i=1}^n \sum_{j=1}^n |a_{ij}|^2 =\|A\|_F^2 \\ & = 9 + |i^2| +4+|9i^2|+|4i^2|+1+1\\ & = 29\\ \Rightarrow |\lambda_2|^2 + |\lambda_3|^2 & \le 25\\ \Rightarrow |\lambda_{1,2}| & \le 5\\ \end{aligned}\\ i=1nλi2=4+λ22+λ32λ22+λ32λ1,2i=1nj=1naij2=AF2=9+i2+4+9i2+4i2+1+1=29255

附录2:特征值的界—相关定理证明

方法2引理证明 B ∈ C n × n B\in \mathbb{C}^{n\times n} BCn×n,列向量 y ∈ C n y\in \mathbb{C}^{n} yCn满足 ∥ y ∥ 2 = 1 \|y\|_2=1 y2=1,则
∣ y H B y ∣ ≤ ∥ B ∥ m ∞ |y^HBy| \le \|B\|_{m_\infty} yHByBm
【证明】:设 B = ( b i j ) ∈ C n × n , y = ( η 1 , . . . , η n ) T B=(b_{ij})\in \mathbb{C}^{n\times n},y=(\eta_1,...,\eta_n)^T B=(bij)Cn×n,y=(η1,...,ηn)T,于是有
∣ y H B y ∣ = ∣ ∑ i , j = 1 n η ˉ i b i j η j ∣ ≤ max ⁡ i , j ∣ b i j ∣ ⋅ ∑ i , j = 1 n ∣ η i ∣ ∣ η j ∣ ≤ max ⁡ i , j ∣ b i j ∣ ⋅ 1 2 ∑ i , j = 1 n ( ∣ η i ∣ 2 + ∣ η j ∣ 2 )      ( a 2 + b 2 ≥ 2 ∣ a b ∣ ) = max ⁡ i , j ∣ b i j ∣ ⋅ 1 2 ( ∑ j = 1 n ∥ y ∥ 2 2 + ∑ i = 1 n ∥ y ∥ 2 2 ) = max ⁡ i , j ∣ b i j ∣ ⋅ 1 2 ( n + n ) = ∥ B ∥ m ∞ \begin{aligned} |y^HBy| &=|\sum_{i,j=1}^n \bar{\eta}_i b_{ij} \eta_j| \le \max_{i,j} |b_{ij}| \cdot \sum_{i,j=1}^n |\eta_i ||\eta_j| \\ & \le \max_{i,j} |b_{ij}| \cdot \frac12 \sum_{i,j=1}^n (|\eta_i |^2 +|\eta_j|^2) \quad \;\; (a^2+b^2 \ge 2|ab|)\\ & = \max_{i,j} |b_{ij}| \cdot \frac12( \sum_{j=1}^n \|y\|_2^2 + \sum_{i=1}^n \|y\|_2^2) \\ & = \max_{i,j} |b_{ij}| \cdot \frac12( n+n) = \|B\|_{m_\infty}\\ \end{aligned} yHBy=i,j=1nηˉibijηji,jmaxbiji,j=1nηiηji,jmaxbij21i,j=1n(ηi2+ηj2)(a2+b22ab)=i,jmaxbij21(j=1ny22+i=1ny22)=i,jmaxbij21(n+n)=Bm

方法2证明
{ ∣ λ ∣ ≤ ∥ A ∥ m ∞ ∣ Re ( λ ) ∣ ≤ 1 2 ∥ A + A H ∥ m ∞ ∣ Im ( λ ) ∣ ≤ 1 2 ∥ A − A H ∥ m ∞ \begin{cases} |\lambda| \le \|A\|_{m_\infty} \\ |\text{Re}(\lambda)| \le \frac12 \|A+A^H\|_{m_\infty} \\ |\text{Im}(\lambda)| \le \frac12 \|A-A^H\|_{m_\infty} \\ \end{cases} λAmRe(λ)21A+AHmIm(λ)21AAHm
【证明】:令 x ∈ C n × 1 x\in \mathbb{C}^{n\times 1} xCn×1 A A A的属于特征值 λ \lambda λ的单位特征向量,即 A x = λ x Ax=\lambda x Ax=λx x H x = I x^Hx=I xHx=I,由瑞利商理论得 λ = x H A x \lambda=x^HAx λ=xHAx λ ˉ = x H A H x \bar{\lambda}=x^HA^Hx λˉ=xHAHx.由方法2引理得
∣ λ ∣ = ∣ x H A x ∣ ≤ ∥ A ∥ m ∞ ∣ Re ( λ ) ∣ = 1 2 ∣ λ + λ ˉ ∣ = 1 2 ∣ x H ( A + A H ) x ∣ ≤ 1 2 ∥ A + A H ∥ m ∞ ∣ Im ( λ ) ∣ = 1 2 ∣ λ − λ ˉ ∣ = 1 2 ∣ x H ( A − A H ) x ∣ ≤ 1 2 ∥ A − A H ∥ m ∞ |\lambda| = |x^HAx| \le \|A\|_{m_\infty} \\ |\text{Re}(\lambda)| =\frac12|\lambda+\bar{\lambda}| = \frac12|x^H(A+A^H)x| \le \frac12 \|A+A^H\|_{m_\infty} \\ |\text{Im}(\lambda)| =\frac12|\lambda-\bar{\lambda}| = \frac12|x^H(A-A^H)x| \le \frac12 \|A-A^H\|_{m_\infty} \\ λ=xHAxAmRe(λ)=21λ+λˉ=21xH(A+AH)x21A+AHmIm(λ)=21λλˉ=21xH(AAH)x21AAHm

参考文献

程云鹏, 凯院, 仲. 矩阵论[M]. 西北工业大学出版社, 2006.

  • 18
    点赞
  • 84
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 3
    评论
协方差矩阵是一个对称矩阵,它有n个实特征值和n个对应的特征向量。假设协方差矩阵为C,其特征值为λ1, λ2, ..., λn,对应的特征向量为v1, v2, ..., vn。 首先,我们可以使用numpy库中的函数计算出协方差矩阵的特征值和特征向量,代码如下: ```python import numpy as np C = np.array([[1, 0.5, 0.5], [0.5, 1, 0], [0.5, 0, 2]]) # 一个3*3的协方差矩阵,用于示例 eig_vals, eig_vecs = np.linalg.eig(C) # 计算特征值和特征向量 print("特征值:", eig_vals) print("特征向量:", eig_vecs) ``` 输出结果为: ``` 特征值: [0.5 1.5 2.] 特征向量: [[-0.70710678 -0.57735027 0.40824829] [ 0. -0.57735027 -0.81649658] [ 0.70710678 -0.57735027 0.40824829]] ``` 其中,特征值是一个一维数组,特征向量是一个n×n的矩阵,每列对应一个特征向量。 接下来,我们可以使用特征值计算熵估计值。熵估计值是指数据的不确定性或信息量的度量,可以使用特征值计算。具体地,假设协方差矩阵的特征值为λ1, λ2, ..., λn,那么熵估计值为: $$H = \frac{1}{2} \log_2 \prod_{i=1}^{n} \lambda_i$$ 代码如下: ```python H = 0.5 * np.log2(np.prod(eig_vals)) # 计算熵估计值 print("熵估计值:", H) ``` 输出结果为: ``` 熵估计值: 1.3219280948873622 ``` 注意,这里使用了自然对数的换底公式,将底数换成了2,得到的结果是以比特为单位的熵估计值。如果使用其他的底数,得到的结果单位也会相应地改变。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

SL_World

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值