矩阵论总结（一）

最新推荐文章于 2023-11-24 20:08:09 发布

愤怒的卤蛋

最新推荐文章于 2023-11-24 20:08:09 发布

阅读量106

点赞数

文章标签：矩阵机器学习线性代数

本文链接：https://blog.csdn.net/qq_42823933/article/details/134342273

版权

【本文基于线性代数知识，将线性代数的内容扩展到复数域，包含线性代数的内容均已省略】

矩阵的相似变换

$\rm Jordan$ 标准形

并不是所有矩阵都可以相似于对角阵，但所有矩阵都可相似于一个 $\rm Jordan$ 矩阵。

设 $\pmb A\in \pmb C^{n\times n}$ ，则 $\pmb A$ 与一个 $\rm Jordan$ 矩阵 $\pmb J$ 相似，即存在 $\pmb P \in \pmb C_n^{n \times n}$ ，使得 $\pmb P^{-1} \pmb A \pmb P = \pmb J$ 。这个 $\rm Jordan$ 矩阵 $\pmb J$ 除 $\rm Jordan$ 块的排列次序外由 $\pmb A$ 唯一决定，称 $\pmb J$ 为 $\pmb A$ 的 $\text{Jordan}$ 标准形。
$\pmb J = \begin{bmatrix} \pmb J_1 &&& \\ & \pmb J_2 && \\ &&\ddots& \\ &&&\pmb J_s \end{bmatrix} ,\pmb J_i = \begin{bmatrix} \lambda_i &1&& \\ & \lambda_i &\ddots& \\ &&\ddots&1 \\ &&&\lambda_i \end{bmatrix}_{r_i \times r_i}$
$\rm Jordan$ 求解方法为：

特征向量法

如果 $\lambda_i$ 是 $\pmb A$ 的单特征值，则对应一阶 $\rm Jordan$ 块 $\pmb J_i=(\lambda_i)$ ；如果 $\lambda_i$ 是 $\pmb A$ 的 $r_i$ 重特征值，则对应 $\lambda_i$ 有几个线性无关的特征向量，就有几个以 $\lambda_i$ 为对角元素的 $\rm Jordan$ 块，这些 $\rm Jordan$ 块的阶数之和等于 $r_i$ 。
初等变换法

化初等变换特征矩阵 $\lambda \pmb I-\pmb A$ 为 $\rm Smith$ 标准形，即
$\pmb S(\lambda) = \begin{bmatrix} d_1(\lambda) &&&&&&\\ &d_2(\lambda)&&&&&\\ &&\ddots&&&& \\ &&&d_r(\lambda)&&&\\ &&&&0&&\\ &&&&&\ddots&\\ &&&&&&0\\ \end{bmatrix}$
其中 $r$ 为矩阵的秩， $d_i(\lambda)$ 被称为 $\pmb A$ 的不变因子， $d_i(\lambda)$ 都是首一多项式，且
$d_i(\lambda) \mid d_{i+1}(\lambda)$
将 $\pmb A$ 的每个次数大于零的不变因子 $d_i(\lambda)$ 分解为互不相同的一次因式方幂的乘积，这些一次因式的方幂称为 $\pmb A$ 的初等因子，设 $\pmb A$ 的全部初等因子为
$(\lambda-\lambda_1)^{r_1},(\lambda-\lambda_2)^{r_2},\cdots,(\lambda-\lambda_s)^{r_s}$
其中 $\lambda_1,\lambda_2,\cdots,\lambda_s$ 可能是相同的， $r_1+r_2+\cdots+r_s = n$

写出每个初等因子 $(\lambda-\lambda_i)^{r_i}$ 对应的 $\rm Jordan$ 块，其阶为 $r_i$ ，对角元素为 $\lambda_i$
行列式因子法

设 $\lambda$ 矩阵 $\pmb A(\lambda)$ 的秩为 $r$ ，对于正整数 $k$ ， $\pmb A(\lambda)$ 的全部 $k$ 阶子式的首一最大公因式 $D_k(\lambda)$ 称为 $\pmb A(\lambda)$ 的 $k$ 阶行列式因子。

其中 $D_k(\lambda) =d_1(\lambda)d_2(\lambda) \cdots d_k(\lambda)$ ，则
$d_1(\lambda) =D_1(\lambda),d_2(\lambda) = \frac{D_2(\lambda)}{D_1(\lambda)},\cdots,d_r(\lambda) = \frac{D_r(\lambda)}{D_{r-1}(\lambda)}$
根据 $k$ 阶行列式因子，可求出初等因子，后面的过程与初等变换类似

求出 $\rm Jordan$ 矩阵后，对应的相似变换矩阵 $\pmb P=(\pmb p_1,\pmb p_2,\cdots,\pmb p_n)$ 由 $\pmb P^{-1}\pmb A \pmb P =\pmb J \rightarrow \pmb A \pmb P = \pmb P \pmb J$ 得到（保证方程左边是 $I - A$ ，与前面的特征矩阵对应，否则可能出错）。由于重特征值对应的特征向量并不都是线性不相关的，这里涉及到广义特征向量，求解时需要依赖于其他特征向量。

当依赖的特征向量对应的特征值的重数 $\geq3$ 时，为了避免无解的情况，一般要取依赖的特征向量为特征值对应的所有线性无关的特征向量的线性组合，分析 $k$ 取何值方程有解，可以求出对应的广义特征向量。最后还需要修改依赖的特征向量的取值，再计算广义特征向量。

应用： $\rm Jordan$ 块的幂
$\pmb J_i = \begin{bmatrix} \lambda_i &1&& \\ & \lambda_i &\ddots& \\ &&\ddots&1 \\ &&&\lambda_i \end{bmatrix}_{r_i \times r_i}$

$\begin{aligned} \pmb J_i^k &= \begin{bmatrix} \lambda_i^k &C_k^1\lambda_i^{k-1} &C_k^2\lambda_i^{k-2} &\cdots &C_k^{r_i-1}\lambda_i^{k-r_i+1} \\ &\lambda_i^k &C_k^1\lambda_i^{k-1} &\cdots &C_k^{r_i-2}\lambda_i^{k-r_i+2} \\ &&&\ddots &\vdots \\ &&&\ddots &C_k^{1}\lambda_i^{k-1}\\ &&&& \lambda_i^k \end{bmatrix}_{r_i \times r_i} \\ &= \begin{bmatrix} \lambda_i^k &\cfrac{1}{1!}(\lambda^k)^\prime &\cfrac{1}{2!}(\lambda^k)^{\prime \prime} &\cdots &\cfrac{1}{(r_i-1)!}(\lambda^k)^{(r_i-1)} \\ &\lambda_i^k &\cfrac{1}{1!}(\lambda^k)^\prime &\cdots &\cfrac{1}{(r_i-2)!}(\lambda^k)^{(r_i-2)} \\ &&&\ddots &\vdots \\ &&&\ddots&\cfrac{1}{1!}(\lambda^k)^\prime\\ &&&&\lambda^k \end{bmatrix} \end{aligned}_{\lambda =\lambda_i}$

$\rm Hamilton-Cayley$ 定理

$\rm Hamilton-Cayley$ ：设 $\pmb A \in \pmb C^{n \times n},\psi(\lambda) = \det (\lambda \pmb I - \pmb A)$ ，则 $\psi(\pmb A) = \pmb O$
$f(\lambda)$ 是多项式，如果有 $f(\pmb A) = \pmb O$ ，则称 $f(\lambda)$ 为 $\pmb A$ 的零化多项式
在 $\pmb A$ 的零化多项式中，次数最低的首一多项式称为 $\pmb A$ 的最小多项式，记为 $m_A(\lambda)$
$\pmb A$ 的最小多项式 $m_A(\lambda)$ 整除 $\pmb A$ 的任一零化多项式，且最小多项式是唯一的
$\psi(\lambda) = \det (\lambda \pmb I-\pmb A)$ ，设 $D_{n-1}(\lambda)$ 是 $\lambda \pmb I-\pmb A$ 的 $n - 1$ 阶行列式因子，则
$m_A(\lambda) = \frac{\psi(\lambda)}{D_{n-1}(\lambda)}$
相似矩阵有相同的最小多项式
$\lambda_1,\lambda_2,\cdots,\lambda_t$ 是 $\pmb A$ 的所有互不相同的特征值，则

$m_A(\lambda) = (\lambda-\lambda_1)^{m_1}(\lambda-\lambda_2)^{m_2} \cdots (\lambda-\lambda_t)^{m_t}$
其中 $m_i$ 是 $\pmb A$ 的 $\rm Jordan$ 标准形 $\pmb J$ 中含 $\lambda_i$ 的 $\rm Jordan$ 块的最高阶数

向量的内积

设 $\pmb x=(\xi_1,\xi_2,\cdots,\xi_n)^T \in C^n,\pmb y=(\eta_1,\eta_2,\cdots,\eta_n)^T \in C^n$ ，记向量 $\pmb x$ 与 $\pmb y$ 的内积为
$(\pmb x,\pmb y) = \sum_{k=1}^n \xi_k \bar{\eta}_k = \pmb y^H \pmb x$

$(\pmb x,\pmb y) = \overline{(\pmb y,\pmb x)}$
$(\lambda \pmb x,\pmb y) = \lambda(\pmb x,\pmb y),(\pmb x,\lambda \pmb y) = \overline \lambda (\pmb x,\pmb y)$
$(\pmb x + \pmb y,\pmb z) = (\pmb x,\pmb z) + (\pmb y,\pmb z)$
$(\pmb x,\pmb x) \geq 0$
$\text{Cauchy-Schwarz}:(\pmb x,\pmb y) (\pmb y,\pmb x) \leq (\pmb x,\pmb x) (\pmb y,\pmb y)$

对向量 $\pmb x=(\xi_1,\xi_2,\cdots,\xi_n)^T \in C^n,\pmb y=(\eta_1,\eta_2,\cdots,\eta_n)^T \in C^n$ 应用 $\rm Cauchy-Schwarz$ 不等式，可得
$\bigg(\sum_{k=1}^n \mid \xi_k\mid \mid \eta_k|\bigg)^2 \leq \bigg(\sum_{k=1}^n \mid \xi_k\mid ^2\bigg) \bigg(\sum_{k=1}^n \mid \eta_k\mid ^2\bigg)$

向量的范数

设 $\pmb x =(\xi_1,\xi_2,\cdots,\xi_n)^T \in C^n$ ，记向量 $\pmb x$ 的长度或2范数为
$\parallel \pmb x \parallel_2 =\sqrt{(\pmb x,\pmb x) } = \sqrt{\sum_{k=1}^n \mid\xi_k\mid^2}$

向量的长度具有以下性质：
- 非负性： $\pmb x \neq 0 \Rightarrow\parallel\pmb x \parallel_2>0,\pmb x = 0 \Rightarrow \parallel \pmb x \parallel _2=0$
- 齐次性： $\parallel \lambda \pmb x \parallel _2 = \mid \lambda\mid \parallel \pmb x \parallel _2$
- 三角不等式： $\parallel \pmb x + \pmb y \parallel _2 \leq \parallel \pmb x \parallel _2 + \parallel \pmb y \parallel _2$
当 $\parallel \pmb x \parallel _2=1$ 时，称 $\pmb x$ 为单位向量，当 $\pmb x\neq0$ 时， $\frac{\pmb x}{ \parallel \pmb x \parallel _2}$ 是单位向量，称之为将向量 $\pmb x$ 单位化或规范化，当 $(\pmb x,\pmb y)=0$ 时，称向量 $\pmb x$ 与 $\pmb y$ 正交
设 $\pmb x_1,\pmb x_2,\cdots,\pmb x_s \in \pmb C^n$ 是一组两两正交的非零向量，则 $\pmb x_1,\pmb x_2,\cdots,\pmb x_s$ 线性无关
$\rm Schmidt$ 正交化方法： $\pmb y_j = \pmb x_j - \cfrac{(\pmb x_j,\pmb y_1)}{(\pmb y_1,\pmb y_1)}\pmb y_1 - \cdots - \cfrac{(\pmb x_j,\pmb y_{j-1})}{(\pmb y_{j-1},\pmb y_{j-1})}\pmb y_{j-1},(j=2,\cdots,s)$
酉矩阵： $\pmb A^H \pmb A = \pmb I \iff \pmb A^{-1} = \pmb A^H$
- $\pmb A$ 是酉矩阵 $\Rightarrow \pmb A^{-1}$ 也是酉矩阵
- $\pmb A,\pmb B$ 是酉矩阵 $\Rightarrow \pmb {AB}$ 也是酉矩阵
- $\pmb A$ 是酉矩阵 $\Rightarrow \mid \det \pmb A\mid = 1$
- $\pmb A$ 是酉矩阵 $\iff$ 它的 $n$ 个列向量是两两正交的单位向量

酉相似下的标准形

设 $\pmb A \in \pmb C^{n \times n}$ ，则 $\pmb A$ 可酉相似于上三角矩阵 $\pmb T$ ，即存在 $n$ 阶酉矩阵 $\pmb U$ ，使得
$\pmb U^{-1} \pmb A \pmb U = \pmb U^{H} \pmb A \pmb U = \pmb T \tag{Schur}$

正规矩阵

若 $\pmb A$ 满足 $\pmb A^H \pmb A = \pmb A \pmb A^H$ ，则称 $\pmb A$ 为正规矩阵，常见的有酉矩阵、正交矩阵， $\rm Hermite$ 矩阵（ $\pmb A^H = \pmb A$ ），实对称矩阵、反 $\rm Hermite$ 矩阵（ $\pmb A^H = -\pmb A$ ）、实反对称矩阵、对角矩阵
$\pmb A$ 酉相似于对角矩阵的充要条件是 $\pmb A$ 为正规矩阵
$\rm Hermite$ 矩阵的特征值均为实数，反 $\rm Hermite$ 矩阵的特征值为零或纯虚数
实对称矩阵的特征值均为实数，实反对称矩阵的特征值为零或纯虚数
设 $\pmb A$ 是正规矩阵， $\lambda$ 是 $\pmb A$ 的特征值， $\pmb x$ 是对应 $\lambda$ 的特征向量，则 $\overline \lambda$ 是 $AH \pmb A^H$ 的特征值，对应 $\overline{\lambda}$ 的特征向量仍为 $\pmb x$
设 $\pmb A$ 是正规矩阵， $\lambda,\mu$ 是 $\pmb A$ 的特征值， $\pmb x,\pmb y$ 是对应的特征向量，如果 $\lambda \neq \mu$ ，则 $\pmb x$ 与 $\pmb y$ 正交。
$n$ 阶正规矩阵 $\pmb A$ 酉相似于对角矩阵的具体步骤
- 求出 $\pmb A$ 的全部特征值，设 $\lambda_1,\lambda_2,\cdots,\lambda_s$ 是 $\pmb A$ 的互不相同的特征值，其重数分别为 $r_1,r_2,\cdots,r_s,r_1+r_2+\cdots+r_s=n$
- 对于特征值 $\lambda_i$ ，求出对应的 $r_i$ 个线性无关的特征向量 $\pmb p_{i1},\pmb p_{i2},\cdots,\pmb p_{i{r_i}}$
- 用 $\rm Schmidt$ 正交化方法将 $\pmb p_{i1},\pmb p_{i2},\cdots,\pmb p_{i{r_i}}$ 正交化，再单位化得 $\pmb u_{i1},\pmb u_{i2},\cdots,\pmb u_{i{r_i}}$ ,则酉矩阵
  $\pmb U = (\pmb u_{11},\cdots,\pmb u_{1r_{1}},\pmb u_{21},\cdots,\pmb u_{2r_{2}},\cdots,\pmb u_{s1},\cdots,\pmb u_{sr_{s}})$
  $\pmb U^{-1} \pmb A \pmb U = \pmb U^{H} \pmb A \pmb U = \pmb \Lambda = diag(\lambda_1 \pmb I_{r_1},\lambda_2 \pmb I_{r_2},\cdots,\lambda_s \pmb I_{r_s})$

$\rm Hermite$ 正定矩阵

设 $\pmb A \in C^{n\times n}$ 是 $\rm Hermite$ 矩阵，如果 $\forall \pmb x \in \pmb C^n,x\neq 0$ 都有
$\pmb x^H \pmb A \pmb x >0(\pmb x^H \pmb A \pmb x \geq 0)$
则称 $\pmb A$ 是 $\rm Hermite$ 正定矩阵（半正定矩阵）
设 $\pmb A$ 是 $\rm Hermite$ 矩阵，则下列条件等价
- $\pmb A$ 是 $\rm Hermite$ 正定矩阵(半正定矩阵)
- $\pmb A$ 的特征值全为正实数（非负实数）
- 存在可逆矩阵（矩阵） $\pmb P \in \pmb C^{n\times n}_n$ ,使得 $\pmb A = \pmb P^H \pmb P$
- $n$ 个顺序主子式全为正 $\Delta_k = det A_k \geq 0$ （对半正定矩阵不成立）
设 $\pmb A \in \pmb C^{n \times n}$
- $AHA \pmb A^H \pmb A$ 和 $AAH \pmb A \pmb A^H$ 的特征值全为非负实数
- $AHA \pmb A^H \pmb A$ 和 $AAH \pmb A \pmb A^H$ 的非零特征值相同
- $rank(\pmb A^H \pmb A) = rank(\pmb A \pmb A^H) = rank(\pmb A)$

范数理论

向量范数

向量范数是指： $\forall \pmb x \in \pmb C^n$ 都有一个实数 $\parallel \pmb x \parallel$ 与之对应，且满足向量范数三公理

非负性： $\pmb x \neq \pmb 0 \Longrightarrow \parallel \pmb x \parallel >0,\pmb x = \pmb 0 \Longrightarrow \parallel \pmb x \parallel = 0$
齐次性： $\forall \lambda \in \pmb C \Longrightarrow \parallel \lambda \pmb x \parallel = \mid \lambda\mid \parallel \pmb x \parallel$
三角不等式： $\forall \pmb x ,\pmb y \in \pmb C^n \Longrightarrow \parallel \pmb x +\pmb y \parallel \leq \parallel \pmb x \parallel + \parallel \pmb y \parallel$

向量范数类型

范数名称	范数定义
向量 $1$ 范数	$\parallel \pmb x \parallel_1 = \sum_{k=1}^n \mid \xi_k\mid$
向量 $2$ 范数	$\parallel \pmb x \parallel_2 = \sqrt{\sum_{k=1}^n \mid \xi_k\mid ^2} = \sqrt{\pmb x^H \pmb x}$
向量 $\infty$ 范数	$\parallel\pmb x\parallel_\infty = \max_k \mid \xi_k\mid$
向量 $p$ 范数	$\parallel \pmb x \parallel_p = (\sum_{k=1}^n \mid \xi_k \mid ^p)^{\frac1p}$

向量 $2$ 范数的酉不变性： $\forall \pmb x \in \pmb C^n$ 和任意的 $n$ 阶酉矩阵 $\pmb U$ ，有
$\parallel \pmb U \pmb x \parallel_2 = \parallel \pmb x \parallel_2$
$\lim_{p \rightarrow +\infty} \parallel \pmb x \parallel_p = \parallel \pmb x \parallel_\infty$
从已知范数 $\parallel \cdot \parallel_a$ 构建新的范数： $\parallel \pmb x \parallel_b = \parallel \pmb A \pmb x \parallel_a$
加权范数/椭圆范数： $\parallel \pmb x \parallel_{\pmb A} = \sqrt{\pmb x^H \pmb A \pmb x}$ ， $\pmb A$ 是 $n$ 阶 $\rm Hermite$ 正定矩阵

向量范数的等价

设 $\parallel \cdot \parallel_a$ 和 $\parallel \cdot \parallel_b$ 是 $Cn \pmb C^n$ 上的两种范数，如果 $\exists \alpha,\beta$ ，使 $\forall \pmb x \in \pmb C^n$ 都有
$\alpha \parallel \pmb x \parallel_b \leq \parallel \pmb x \parallel_a \leq \beta \parallel \pmb x \parallel_b$
则称两个向量范数等价

$Cn \pmb C^n$ 上的所有向量范数等价
向量范数的等价性在研究向量序列的收敛问题上有极大的作用。
给定 $Cn \pmb C^n$ 中的向量序列 $\{\pmb x^{(k)}\}$ ，向量序列 $\{\pmb x^{(k)}\}$ 收敛于 $\pmb x$ 的充分必要条件是，对于 $Cn \pmb C^n$ 上的任意一种向量范数 $\parallel \cdot \parallel$ ，都有 $\lim_{ k \rightarrow+\infty} \parallel \pmb x^{(k)} - \pmb x \parallel = 0$

矩阵范数

方阵的范数

对任意 $\pmb A \in \pmb C^{n\times n}$ 都有一个实数 $\parallel \pmb A \parallel$ 与之对应，且满足

非负性： $\pmb A \neq \pmb O \Rightarrow \parallel \pmb A \parallel >0, \pmb A = \pmb O \Rightarrow \parallel \pmb A \parallel = 0$
齐次性： $\parallel \lambda \pmb A \parallel = \mid \lambda \mid \parallel \pmb A \parallel$
三角不等式： $\parallel \pmb A + \pmb B \parallel \leq \parallel \pmb A \parallel + \parallel \pmb B \parallel$
相容性： $\parallel \pmb A \pmb B \parallel \leq \parallel \pmb A \parallel \parallel \pmb B \parallel$

类比向量范数，推广到矩阵范数，有

范数名称	范数定义
矩阵的 $m1 \pmb m_1$ 范数	$\parallel \pmb A \parallel_{m_1} = \sum_{i=1}^n \sum_{j=1}^n\mid a_{ij} \mid$
矩阵的 $\pmb F$ 范数	$\parallel \pmb A \parallel_F = \sqrt{\sum_{i=1}\sum_{j=1}\mid a_{ij}\mid ^2} = \sqrt{tr(\pmb A^H \pmb A)}$
矩阵的 $\pmb m_{\infty}$ 范数	$\parallel \pmb A \parallel_{m_{\infty}} = n \max_{i,j} \mid a_{ij} \mid$

$F$ 范数的酉不变性： $\parallel \pmb U \pmb A \parallel_F = \parallel \pmb A \pmb V \parallel_F = \parallel \pmb U \pmb A \pmb V \parallel_F = \parallel \pmb A \parallel_F$

与向量范数的相容性

设 $\parallel \cdot \parallel_m$ 是 $Cn×n \pmb C^{n \times n}$ 上的矩阵范数， $\parallel \cdot \parallel_v$ 是 $Cn \pmb C^n$ 上的向量范数。如果对 $\forall \pmb A \in \pmb C^{n \times n},\pmb x \in \pmb C^n$ ，都有
$\parallel \pmb A \pmb x \parallel_v \leq \parallel \pmb A \parallel_m \parallel \pmb x \parallel_v$
则称该矩阵范数和向量范数是相容的

$Cn×n \pmb C^{n\times n}$ 上任何一种矩阵范数，在 $Cn \pmb C^n$ 上必存在与它相容的向量范数

从属范数

已知 $Cn \pmb C^n$ 上的向量范数 $\parallel \cdot \parallel_v$ ，对 $\forall \pmb A \in C^{n \times n}$ ，规定
$\parallel \pmb A \parallel = \max_{\pmb x\neq 0}\frac{\parallel \pmb A \pmb x \parallel_v}{\parallel \pmb x \parallel _v}$
则 $\parallel \cdot \parallel$ 是 $Cn×n \pmb C^{n \times n}$ 上与向量范数 $\parallel \cdot \parallel_v$ 相容的矩阵范数，且 $\parallel \pmb I_n \parallel = 1$ ，称之为由向量范数 $\parallel \cdot \parallel_v$ 导出的矩阵范数或从属于向量范数 $\parallel \cdot \parallel_v$ 的矩阵范数，简称导出范数或从属范数。从属范数的本质为求解函数的最大值。

范数名称	定义	别名
$1$ 范数	$\parallel \pmb A \parallel_1 = \max_j \sum_{i=1}^n \mid a_{ij}\mid$	列和范数
$2$ 范数	$\parallel \pmb A \parallel_2 = \sqrt{\lambda_1},\lambda_1$ 是 $AHA \pmb A^H \pmb A$ 的最大特征值	谱范数
$\infty$ 范数	$\parallel \pmb A \parallel_\infty = \max_i \sum_{j=1}^n \mid a_{ij} \mid$	行和范数

设 $\pmb U ,\pmb V$ 为 $n$ 阶酉矩阵，矩阵 $2$ 范数有下列良好性质

$\parallel \pmb A^H \parallel_2 = \parallel \pmb A \parallel_2$
$\parallel \pmb U \pmb A \parallel_2 = \parallel \pmb A \pmb V \parallel_2 = \parallel \pmb U \pmb A \pmb V \parallel_2 = \parallel \pmb A \parallel_2$
若 $\pmb A$ 是正规矩阵，且 $\lambda_1,\lambda_2,\cdots,\lambda_n$ 是 $\pmb A$ 的 $n$ 个特征值，则 $\parallel \pmb A \parallel_2 = \max_k \mid \lambda_k \mid$

长方阵的范数

$\pmb A \in C^{m\times n},\pmb B \in C^{ n \times l}$

范数名称	定义
$m_1$ 范数	$\parallel \pmb A \parallel_{m_1} = \sum_{i=1}^m \sum_{j=1}^n \mid a_{ij} \mid$
$F$ 范数	$\parallel \pmb A \parallel_{F} = \sqrt{\sum_{i=1}^m \sum_{j=1}^n \mid a_{ij} \mid ^2} = \sqrt{tr(\pmb A^H\pmb A)}$
$M$ 范数/最大范数	$\parallel \pmb A \parallel_{M} = \max\{m,n\} \max_{i,j}\mid a_{ij}\mid$
$G$ 范数/几何平均范数	$\parallel \pmb A \parallel_{G} = \sqrt{mn} \max_{ij}\mid a_{ij} \mid$
$1$ 范数/列和范数	$\parallel \pmb A \parallel_{1} =\max_j \sum_{i=1}^m \mid a_{ij} \mid$
$2$ 范数/谱范数	$\parallel \pmb A \parallel_{2} =\sqrt{\pmb A^H \pmb A的最大特征值}$
$\infty$ 范数/行和范数	$\parallel \pmb A \parallel_{\infty} = \max_i \sum_{j=1}^n \mid a_{ij} \mid$

范数应用举例

矩阵的谱半径

设 $\pmb A \in \pmb C^{n\times n},\lambda_1,\lambda_2,\cdots,\lambda_n$ 为 $\pmb A$ 的 $n$ 个特征值，称
$\rho(\pmb A) = \max_j \mid \lambda_j \mid$
为 $\pmb A$ 的谱半径

$\rho(\pmb A^k) = (\rho(\pmb A))^k$
$\rho(\pmb A^H \pmb A) = \rho(\pmb A \pmb A^H) = \parallel \pmb A \parallel_2^2$
当 $\pmb A$ 是正规矩阵时， $\rho(\pmb A) = \parallel \pmb A \parallel_2$
对于任一矩阵范数 $\parallel \cdot \parallel$ ，有 $\rho(\pmb A) \leq \parallel \pmb A \parallel$
对任意给定的正数 $\varepsilon$ ，存在某一矩阵范数 $\parallel \cdot \parallel_m$ ，使得 $\parallel \pmb A \parallel_m \leq \rho(\pmb A) + \varepsilon$

矩阵的条件数

设 $\pmb P \in \pmb C^{n\times n}$ ，若对 $Cn×n \pmb C^{n\times n }$ 上的某一矩阵范数 $\parallel \cdot \parallel$ 有 $\parallel \pmb P \parallel \leq 1$ ，则 $\pmb I - \pmb P$ 可逆
设 $\pmb A \in \pmb C_n^{n \times n},\delta \pmb A \in \pmb C^{n \times n}$ 。若对 $Cn×n \pmb C^{n \times n}$ 上的某一矩阵范数 $\parallel \cdot \parallel$ 有 $\parallel \pmb A^{-1} \delta\pmb A\parallel \leq 1$ ，则
- $\pmb A + \delta A$ 可逆
- $\parallel (\pmb A + \delta \pmb A)^{-1}\parallel \leq \cfrac{\parallel \pmb A^{-1} \parallel}{1- \parallel \pmb A^{-1} \delta \pmb A \parallel}$
- $\cfrac{\parallel \pmb A^{-1} - (\pmb A + \delta \pmb A)^{-1}\parallel}{\parallel \pmb A^{-1} \parallel} \leq \cfrac{\parallel \pmb A^{-1} \delta \pmb A \parallel}{1- \parallel \pmb A^{-1} \delta \pmb A \parallel}$
设 $\pmb A \in \pmb C^{n\times n}_n,\delta \pmb A \in \pmb C^{n \times n}$ ，若对 $Cn×n \pmb C^{n \times n}$ 上的某一矩阵范数 $\parallel \cdot \parallel$ 有 $\parallel \pmb A^{-1} \parallel \parallel \delta \pmb A \parallel <1$ ，则
$\frac{\left\|\boldsymbol{A}^{-1}-(\boldsymbol{A}+\delta \boldsymbol{A})^{-1}\right\|}{\left\|\boldsymbol{A}^{-1}\right\|} \leqslant \frac{\|\boldsymbol{A}\|\left\|\boldsymbol{A}^{-1}\right\| \frac{\|\delta \boldsymbol{A}\|}{\|\boldsymbol{A}\|}}{1-\|\boldsymbol{A}\|\left\|\boldsymbol{A}^{-1}\right\| \frac{\|\delta \boldsymbol{A}\|}{\|\boldsymbol{A}\|}}$
设 $\pmb A \in \pmb C^{n\times n}_n,\delta \pmb A \in \pmb C^{n \times n},\pmb b ,\delta \pmb b \in \pmb C^{n}$ ，若对 $Cn×n \pmb C^{n\times n}$ 上的某一矩阵范数 $\parallel \cdot \parallel$ 有 $\parallel \pmb A^{-1} \parallel \parallel \delta \pmb A \parallel <1$ ，则非齐次线性方程组
$\boldsymbol{A x}=\boldsymbol{b} \quad \& \quad(A+\delta \boldsymbol{A})(\boldsymbol{x}+\delta \boldsymbol{x})=\boldsymbol{b}+\delta \boldsymbol{b}$
解满足
$\frac{\|\delta \boldsymbol{x}\|_{\mathrm{v}}}{\|\boldsymbol{x}\|_{\mathrm{v}}} \leqslant \frac{\|\boldsymbol{A}\|\left\|\boldsymbol{A}^{-1}\right\|}{1-\|\boldsymbol{A}\|\left\|\boldsymbol{A}^{-1}\right\| \frac{\|\delta \boldsymbol{A}\|}{\|\boldsymbol{A}\|}}\left(\frac{\|\delta \boldsymbol{A}\|}{\|\boldsymbol{A}\|}+\frac{\|\delta \boldsymbol{b}\|_{\mathrm{v}}}{\|\boldsymbol{b}\|_{\mathrm{v}}}\right)$
其中 $\parallel \cdot \parallel_v$ 是 $Cn \pmb C^n$ 上与矩阵范数 $\parallel \cdot \parallel$ 相容的向量范数
设 $\pmb A \in \pmb C_n^{n \times n}$ ， $\parallel \cdot \parallel$ 是 $Cn×n \pmb C^{n \times n}$ 上的矩阵范数，称
$cond(\pmb A) = \parallel \pmb A \parallel \ \parallel \pmb A^{-1} \parallel$
为矩阵 $\pmb A$ 的条件数。

一般地，如果矩阵 $\pmb A$ 的条件数大就称 $\pmb A$ 对于求逆矩阵或求解线性方程组是病态的，否则是良态的。

愤怒的卤蛋

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
矩阵论总结（一）

【本文基于线性代数知识，将线性代数的内容扩展到复数域，包含线性代数的内容均已省略】矩阵的相似变换Jordan\rm JordanJordan标准形并不是所有矩阵都可以相似于对角阵，但所有矩阵都可相似于一个Jordan\rm JordanJordan矩阵。设A∈Cn×n\pmb A\in \pmb C^{n\times n}A∈Cn×n，则A\pmb AA与一个Jordan\rm JordanJordan矩阵J\pmb JJ相似，即存在P∈Cnn×n\pmb P \in \pmb C_n^{n \ti
复制链接

扫一扫