谱半径学习

Nightmare004

已于 2022-08-10 00:07:56 修改

阅读量769

点赞数 1

分类专栏：数学文章标签：学习算法机器学习

于 2022-08-09 11:25:10 首次发布

本文链接：https://blog.csdn.net/qq_39942341/article/details/126238464

版权

数学专栏收录该内容

143 篇文章 18 订阅

订阅专栏

谱半径

设 $\lambda_1,\cdots, \lambda_n$ 为 $\mathbf{A}\in\mathbb{C}^{n\times n}$ 的特征值，则谱半径定义为
$\rho\left(\mathbf{A}\right)=\max\left\{\left|\lambda_1\right|,\cdots, \left|\lambda_n\right|\right\}$

注意 $\|\mathbf{A}\mathbf{v}\|\le\rho\left(\mathbf{A}\right)\|\mathbf{v}\|$ 不一定成立
$\mathbf{C}_r=\begin{pmatrix} 0&\frac{1}{r}\\ r&0\\ \end{pmatrix}$
其中 $r > 1$
则 $\mathbf{C}_r$ 的特征值为 $\pm 1$
$\mathbf{C}_r\mathbf{e}_1=r\mathbf{e}_2$
$\|\mathbf{C}_r\mathbf{e}_1\|=r>1=\rho\left(\mathbf{C}_r\right)\|\mathbf{e}_1\|$
如果 $\mathbf{A}$ 是Hermitian矩阵的话则 $\|\mathbf{A}\mathbf{v}\|\le\rho\left(\mathbf{A}\right)\|\mathbf{v}\|$

性质

性质1

$\rho\left(\mathbf{A}\right)\le \|\mathbf{A}\|$
其中 $\|\cdot\|$ 是任意算子范数

证明：
设 $\lambda$ 是 $\mathbf{A}$ 的特征值， $\mathbf{x}$ 是对应的特征向量
$\left|\lambda\right|\|\mathbf{x}\|=\|\lambda\mathbf{x}\|=\|\mathbf{Ax}\|\le\|\mathbf{A}\|\ \|\mathbf{x}\|\Rightarrow \rho\left(\mathbf{A}\right)\le \|\mathbf{A}\|$

性质2

对于 $\epsilon>0$ ，存在某种矩阵范数 $\|\cdot\|$ ,使得
$\|\mathbf{A}\|\le\rho\left(\mathbf{A}\right)+\epsilon$

证明：
由若尔当分解定理
$\mathbf{A}=\mathbf{S}\begin{pmatrix} \mathbf{J}_{n_1}\left(\lambda_1\right)&0&\cdots&0\\ 0&\mathbf{J}_{n_2}\left(\lambda_2\right)&\ddots&\vdots\\ \vdots&\ddots&\ddots&0\\ 0&\cdots&0&\mathbf{J}_{n_k}\left(\lambda_k\right)\\ \end{pmatrix}\mathbf{S}^{-1}$
其中 $\mathbf{S}$ 是可逆矩阵， $\lambda_1,\cdots,\lambda_k$ 是 $\mathbf{A}$ 的特征值， $n_1+\cdots+n_k=n$

设
$\mathbf{D}\left(\eta\right)=\begin{pmatrix} \mathbf{D}_{n_1}\left(\eta\right)&0&\cdots&0\\ 0&\mathbf{D}_{n_2}\left(\eta\right)&\ddots&\vdots\\ \vdots&\ddots&\ddots&0\\ 0&\cdots&0&\mathbf{D}_{n_k}\left(\eta\right)\\ \end{pmatrix}$
其中
$\mathbf{D}_m\left(\eta\right)=\begin{pmatrix} \eta &0&\cdots&0\\ 0&\eta^2&\ddots&\vdots\\ \vdots&\ddots&\ddots&0\\ 0&\cdots&0&\eta^m\\ \end{pmatrix}$

$\mathbf{D}\left(\frac{1}{\epsilon}\right)\mathbf{S}^{-1}\mathbf{A}\mathbf{S}\mathbf{D}\left(\epsilon\right)= \begin{pmatrix} \mathbf{B}_{n_1}\left(\lambda_1,\epsilon\right)&0&\cdots&0\\ 0&\mathbf{B}_{n_2}\left(\lambda_2,\epsilon\right)&\ddots&\vdots\\ \vdots&\ddots&\ddots&0\\ 0&\cdots&0&\mathbf{B}_{n_k}\left(\lambda_k,\epsilon\right)\\ \end{pmatrix}$
其中
$\mathbf{B}_{m}\left(\lambda,\epsilon\right)=\mathbf{D}_m\left(\frac{1}{\epsilon}\right)\mathbf{J}_m\left(\lambda\right)\mathbf{D}_m\left(\epsilon\right)=\begin{pmatrix} \lambda&\epsilon&0&\cdots&0\\ 0&\lambda&\epsilon&0&\vdots\\ 0&\ddots&\ddots&\ddots&0\\ \vdots&\ddots&\ddots&\lambda&\epsilon\\ 0&\cdots&0&0&\lambda\\ \end{pmatrix}$

定义矩阵范数
$\|\mathbf{A}\|=\|\mathbf{D}\left(\frac{1}{\epsilon}\right)\mathbf{S}^{-1}\mathbf{A}\mathbf{S}\mathbf{D}\left(\epsilon\right)\|_1$
接下来验证 $\|\cdot\|$ 是矩阵范数

容易验证非负性和正齐次性

三角不等式：
$\begin{aligned} \|\mathbf{A}+\mathbf{B}\|&=\|\mathbf{D}\left(\frac{1}{\epsilon}\right)\mathbf{S}^{-1}\left(\mathbf{A}+\mathbf{B}\right)\mathbf{S}\mathbf{D}\left(\epsilon\right)\|_1\\ &=\|\mathbf{D}\left(\frac{1}{\epsilon}\right)\mathbf{S}^{-1}\mathbf{A}\mathbf{S}\mathbf{D}\left(\epsilon\right)+\mathbf{D}\left(\frac{1}{\epsilon}\right)\mathbf{S}^{-1}\mathbf{B}\mathbf{S}\mathbf{D}\left(\epsilon\right)\|_1\\ &\le \|\mathbf{D}\left(\frac{1}{\epsilon}\right)\mathbf{S}^{-1}\mathbf{A}\mathbf{S}\mathbf{D}\left(\epsilon\right)\|_1+\|\mathbf{D}\left(\frac{1}{\epsilon}\right)\mathbf{S}^{-1}\mathbf{B}\mathbf{S}\mathbf{D}\left(\epsilon\right)\|_1\\ &=\|\mathbf{A}\|+\|\mathbf{B}\| \end{aligned}$

次乘性：

因为 $\mathbf{D}\left(\frac{1}{\epsilon}\right)\mathbf{D}\left(\epsilon\right)=\mathbf{I}$
$\begin{aligned} \|\mathbf{AB}\|&=\|\mathbf{D}\left(\frac{1}{\epsilon}\right)\mathbf{S}^{-1}\mathbf{AB}\mathbf{S}\mathbf{D}\left(\epsilon\right)\|_1\\ &=\|\mathbf{D}\left(\frac{1}{\epsilon}\right)\mathbf{S}^{-1}\mathbf{A}\mathbf{S}\mathbf{D}\left(\epsilon\right)\mathbf{D}\left(\frac{1}{\epsilon}\right)\mathbf{S}^{-1}\mathbf{B}\mathbf{S}\mathbf{D}\left(\epsilon\right)\|_1\\ &\le \|\mathbf{D}\left(\frac{1}{\epsilon}\right)\mathbf{S}^{-1}\mathbf{A}\mathbf{S}\mathbf{D}\left(\epsilon\right)\|_1 \|\mathbf{D}\left(\frac{1}{\epsilon}\right)\mathbf{S}^{-1}\mathbf{B}\mathbf{S}\mathbf{D}\left(\epsilon\right)\|_1\\ &=\|\mathbf{A}\|\|\mathbf{B}\| \end{aligned}$
所以 $\|\cdot\|$ 是矩阵范数

于是
$\|\mathbf{A}\|=\max_{i\in\left\{1,2,\cdots,n\right\}}\left(\left|\lambda_i\right|+\epsilon\right)=\rho\left(\mathbf{A}\right)+\epsilon$

性质3

$\rho\left(\mathbf{A}\right)<1 \Leftrightarrow \lim\limits_{k\to\infty}\mathbf{A}^k=0$

证明：
设 $\mathbf{A}$ 的特征值为 $\lambda$ ,对应的特征向量为 $\mathbf{v}$
假设 $\lim\limits_{k\to\infty}\mathbf{A}^k=0$
$\begin{aligned} 0&=\left(\lim\limits_{k\to\infty}\mathbf{A}^k\right)\mathbf{v}\\ &=\lim\limits_{k\to\infty}\left(\mathbf{A}^k\mathbf{v}\right)\\ &=\lim\limits_{k\to\infty}\left(\lambda^k\mathbf{v}\right)\\ &=\mathbf{v}\lim\limits_{k\to\infty}\lambda^k\\ \end{aligned}$
因为 $\mathbf{v}\neq 0$ ,
$\lim\limits_{k\to\infty}\lambda^k=0\Rightarrow \left|\lambda\right|<1 \Rightarrow \rho\left(\mathbf{A}\right)<1$

假设 $\rho\left(\mathbf{A}\right)<1$
由若尔当分解定理
$\mathbf{A}=\mathbf{S}\begin{pmatrix} \mathbf{J}_{n_1}\left(\lambda_1\right)&0&\cdots&0\\ 0&\mathbf{J}_{n_2}\left(\lambda_2\right)&\ddots&\vdots\\ \vdots&\ddots&\ddots&0\\ 0&\cdots&0&\mathbf{J}_{n_k}\left(\lambda_k\right)\\ \end{pmatrix}\mathbf{S}^{-1}$
其中 $\mathbf{S}$ 是可逆矩阵， $\lambda_1,\cdots,\lambda_k$ 是 $\mathbf{A}$ 的特征值， $n_1+\cdots+n_k=n$
由若尔当块的性质,对于充分大的 $k$ ,有
$\mathbf{J}_{n_{i}}^{k}\left(\lambda_{i}\right)=\left[\begin{array}{ccccc} \lambda_{i}^{k} & \left(\begin{array}{c} k \\ 1 \end{array}\right) \lambda_{i}^{k-1} & \left(\begin{array}{c} k \\ 2 \end{array}\right) \lambda_{i}^{k-2} & \cdots & \left(\begin{array}{c} k \\ n_{i}-1 \end{array}\right) \lambda_{i}^{k-n_{i}+1} \\ 0 & \lambda_{i}^{k} & \left(\begin{array}{c} k \\ 1 \end{array}\right) \lambda_{i}^{k-1} & \cdots & \left(\begin{array}{c} k \\ n_{i}-2 \end{array}\right) \lambda_{i}^{k-n_{i}+2} \\ \vdots & \vdots & \ddots & \ddots & \vdots \\ 0 & 0 & \ldots & \lambda_{i}^{k} & \left(\begin{array}{c} k \\ 1 \end{array}\right) \lambda_{i}^{k-1} \\ 0 & 0 & \cdots & 0 & \lambda_{i}^{k} \end{array}\right]$
所以
$\lim\limits_{k\to\infty}\mathbf{J}_{n_i}^k=0\Rightarrow \lim\limits_{k\to\infty}\mathbf{J}^k=0\Rightarrow \lim\limits_{k\to\infty}\mathbf{A}^k=\lim\limits_{k\to\infty}\mathbf{S}\mathbf{J}^k\mathbf{S}^{-1}=\mathbf{S}\left(\lim\limits_{k\to\infty}\mathbf{J}^k\right)\mathbf{S}^{-1}=0$

Gelfand定理

$\rho\left(\mathbf{A}\right)=\lim\limits_{k\to\infty}\|\mathbf{A}^{k}\|^{\frac{1}{k}}$

证明： $k\ge 0$
$\rho\left(\mathbf{A}\right)^k=\rho\left(\mathbf{A}^k\right)=\|\mathbf{A}^k\|\Rightarrow\rho\left(\mathbf{A}\right)\le\|\mathbf{A}^k\|^{\frac{1}{k}}\Rightarrow \rho\left(\mathbf{A}\right)\le\lim\limits_{k\to\infty}\|\mathbf{A}^k\|^{\frac{1}{k}}$

存在范数 $\|\cdot\|_M$ ,使得 $\|\mathbf{A}\|_M\le \rho\left(\mathbf{A}\right)+\epsilon$
( $\|\cdot\|_M$ 的 $M$ 主要是为了和上面的范数区分)
由范数的等价性
$\exists C>0,s.t.\ \|\cdot\|\le C\|\cdot\|_M$
所以
$\|\mathbf{A}^k\|\le C\|\mathbf{A}^k\|_M\le C\|\mathbf{A}\|_M^k\le C\left(\rho\left(\mathbf{A}\right)+\epsilon\right)^k\\ \|\mathbf{A}^k\|^{\frac{1}{k}} \le C^{\frac{1}{k}}\left(\rho\left(\mathbf{A}\right)+\epsilon\right)\\ \lim\limits_{k\to\infty} \|\mathbf{A}^k\|^{\frac{1}{k}}\le \rho\left(\mathbf{A}\right)+\epsilon$

参考：
https://www.math.drexel.edu/~foucart/TeachingFiles/F12/M504Lect6.pdf
https://en.wikipedia.org/wiki/Spectral_radius

Nightmare004

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
谱半径学习

设λ1,⋯,λn为A∈Cn×n的特征值，则谱半径定义为ρ(A)=max{∣λ1∣,⋯,∣λn∣}注意∥Av∥≤ρ(A)∥v∥不一定成立Cr=(0rr10)其中r>1则Cr的特征值为±1Cre1=re2∥Cre1∥=r>1=ρ(Cr)∥e1∥如果A。.........
复制链接

扫一扫