当我学矩阵论时，我学到了什么？

最新推荐文章于 2023-11-01 11:51:27 发布

置顶嘿哈哈哈

最新推荐文章于 2023-11-01 11:51:27 发布

阅读量2.3k

点赞数 7

分类专栏：考试攻略读书笔记文章标签：线性代数矩阵分解广义逆矩阵函数直积

本文链接：https://blog.csdn.net/qq_39384184/article/details/111477354

版权

读书笔记同时被 2 个专栏收录

106 篇文章 13 订阅

订阅专栏

考试攻略

66 篇文章 40 订阅

订阅专栏

当我学矩阵论时，我学到了什么？

learning why, thinking what, then forgetting how.

随着时间的流逝，知识总会被遗忘和被沉淀，我们无法选择去遗忘那一部分，但是我们可以选择去沉淀那一部分。

教材为：《矩阵论教程第2版（张绍飞、赵迪）》

一、线性代数引论

1.1 线性空间

引出加群和数域的概念。

加群和数域共同组成线性空间或向量空间。加群中为向量，数域中为标量。

某加群在某数域下构成线性空间。

提出了零空间或核作为方程组 AX=0 的解空间的概念。

提出了线性无关和维数的概念。

提出了基底和在其下表示的坐标的概念。

空间维数是和数域相关的。例如，C 是 C 上的一维空间，是 R 上的二维空间，是 Q 上的无限维空间。

提出了用于基底变换的过渡矩阵或变换矩阵的概念。基变换矩阵确定了坐标变换公式。

提出了子空间的概念。

和空间的维度 = 两个子空间的维度和 - 交空间的维度。

并空间不是子空间。

如果交空间为空集，则和空间为直和空间。

1.2 线性变换及矩阵

提出了线性映射的概念，意为两个线性空间上的映射。如果为到自身的线性映射，则为线性变换。

常见线性变换：

恒等变换
零变换
伸缩变换
平面旋转变换
平面反射变换
投影变换
微分算子（微分算子仅为线性映射，不是线性变换）
积分算子

提出了核空间和像空间，核空间的维度为零度或亏，像空间的维度为秩，亏加秩等于原始空间的维度。

线性变换和矩阵之间不仅有一一对应关系且有完全相同的代数结构。

若线性映射是一个双射，则两个线性空间是同构的。

同构的线性空间视为一个，而刻画其特征的是其维数。所以：维数相等等价于线性空间同构。

线性变换的矩阵表示，因为基选择不同而表现为不同的形式，同一个线性变换在不同基下的矩阵表示是相似的。即 $AC = BC -> B = C^{-1}AC$

相似矩阵反映的是同一线性变换，故相似矩阵间所有的共同性质就是线性变换所特有的，即相似关系是矩阵间的等价关系。在相似等价类中，最简单的形式就是矩阵标准形（Jordan），也即线性变换在某一基下的表现矩阵最简单。

针对一个线性变换，提出了特征值和特征向量的概念，从几何上来看，特征向量在线性变换作用下保持方位不变。

特征值可由 $∣ λ I - A ∣ = 0$ 求得，特征向量可由 $λ_1I-A)X = 0$ 求得。

对于某个特征值，其全部特征向量加上零向量，就构成了一个线性子空间，成为特征子空间。

由相似关系即线性变换的等价关系：相似矩阵有相同的特征值。即线性变换的矩阵的特征多项式与基的选取无关，而直接由线性变换所决定，所以可称为线性变换的特征多项式。

由多项式的一些性质可以推出：（1）特征值之和为矩阵的迹；（2）特征值之积为行列式的值

Schur 引理：任意方阵都相似于一个上三角阵，且主对角元即为全部特征值。

多项式函数的情况下，特征值的函数值等价于线性变换矩阵的函数值的特征值，即 $φ (λ) = λ (φ (A))$

不同特征值的特征向量是线性无关的，因为属于相互正交的线性子空间。

最小零化多项式的概念：零化多项式即以矩阵为实参，函数值为零的多项式。特征多项式必为零化多项式，但是不一定为最小零化多项式，或许还可以去掉一些特征根的重根。

1.3 Jordan 标准形

关于 Jordan 标准形，先讨论一类简单的情况，即可对角化矩阵 —— 单纯矩阵。

单纯矩阵的所有特征向量都是线性无关的，否则线性相关的特征向量将形成 Jordan 块，而无法对角化。

在单纯矩阵中，可以有特征根重根，但是特征值的代数重数必须等于特征向量的几何重数，即重根数必须等于特征向量空间的维数。

特别的，单纯矩阵的最小零化多项式无重根，即可以将特征多项式的所有重根全部约去，所得多项式仍为零化多项式。特殊的，幂等矩阵必可对角化，且特征值为 0 和 1

一般的情况，Jordan 标准形由若干个 Jordan 块构成，每个 Jordan 块的大小为初等因子的次数，矩阵单纯即为初等因子都为一次的。

1.4 欧式空间和酉空间

在线性空间中，向量的基本运算仅为线性运算。向量的长度和夹角等度量概念在线性空间中并没有反映。将度量引入线性空间，得到了欧式空间和酉空间。

即：线性空间 + 内积 = 欧式空间，特殊的，酉空间的内积为共轭内积。

在欧式空间中，定义了向量的长度：向量自身内积开根号。

在欧式空间中，定义了向量的正交（角度）：内积为零则正交（垂直）。

两两正交的向量组必线性无关。定义了标准正交基：两两正交且为单位长的向量组。

可以由任意一组正交基构造标准正交基：Gram-Schmidt 正交化方法。

两个线性子空间正交等价于所有的向量都正交，线性子空间之间的正交关系称为正交补。

线性子空间和其正交补的直和为原欧式空间。

正交变换：保持内积不变的线性变换。即保持长度（范数），角度，距离不变。同时有性质 $Q^T = Q^{-1}$

正交变换矩阵有标准正交基构成，且将标准正交基变换为标准正交基。

酉矩阵：酉空间的正交变换。同时有性质 $U^H = U^{-1}$

二、矩阵的分解

2.1 QR 分解

由 Gram-Schmidt 正交化方法，将任一组基底转化为标准正交基，其标准正交基构成正交矩阵 Q，转化过程为上三角矩阵 R，原基底矩阵为满秩方阵。

即任一满秩方阵，存在 QR 分解，其为一个正交矩阵和上三角矩阵的乘积。

若方程 AX = b 不相容，可由 QR 分解求得最小二乘解。即误差范数最小解。

2.2 正规分解及 Schur 分解

Schur 引理加强：任意酉方阵都酉相似于一个上三角阵，且主对角元即为全部特征值。

正规矩阵： $A^HA = AA^H$

正规矩阵是单纯矩阵的加强：单纯矩阵相似于对角阵，若可以酉相似于对角阵，则为正规矩阵。

同时，正规矩阵的所有特征向量构成标准正交基，而单纯矩阵的特征向量只是线性无关，故正规矩阵可以看作是单纯矩阵的进一步加强。

特征向量的线性无关性和正交性才是线性变换矩阵的实质，而特征根的重数只是数值上的巧合。但是特征值互异，特征向量必然线性无关，即必为单阵。

Schur 分解：正规矩阵分解为酉相似矩阵和对角阵的乘积。 $A = U^HKU$ ，U 为正交特征向量构成的酉矩阵，K 为特征值构成的对角阵。

2.3 满秩分解

满秩分解：将任一矩阵分解为列满秩矩阵和行满秩矩阵的乘积。 $A = F G$

特殊的，有秩一分解。 $A = α β ， λ = β α ，且 α 为相应特征向量$ 。

满秩分解实质上是提取了矩阵的像空间，而像空间的基底不唯一，所以满秩分解也不唯一。

行初等变换可以保持列的线性关系；列初等变换可以保持行的线性关系。

求满秩分解：将矩阵行初等变换为 Hermite 标准形。其相应的行和列构成了满秩分解。

2.4 奇异值分解

奇异值分解，基于 $A^HA$ 和 $AA^H$ 都是酉对称矩阵（Hermte 矩阵），且特征值相同。

存在 Aligner，由标准正交基按行排列，其将标准正交基变换为 01 正交基。
存在 Hanger，由标准正交基按列排列，其将 01 正交基变换为标准正交基。
存在 Stretcher，为对角阵。
SVD = Hanger X Stretcher X Aligner

奇异值分解： $A = VSU^H$

求奇异值分解：

奇异值为 $A^HA$ 和 $AA^H$ 的特征值的开根号。
V 为 $AA^H$ 的正交特征向量加上 $N(A^H)$ 的正交基。
U 为 $A^HA$ 的正交特征向量加上 $N (A)$ 的正交基。

当然，由于算法的冗余性，其可以简化，有一个求奇异值分解的基本步骤：略。

极分解： $A = G U$ ，其中 G 为酉对称矩阵（Hermte 矩阵），U 为酉矩阵。极分解可由 SVD 分解求得。

若方程 AX = b 不相容，可由 SVD 分解求得极小范数最小二乘解。其原理为 SVD 分解将原无解方程投影到了一个有解的空间。

2.5 单纯矩阵的谱分解

单纯矩阵的谱分解：可将单纯矩阵进一步分解为若干幂等阵和特征值的乘积和，相应的，互异幂等阵的乘积为零，全部幂等阵的和为单位阵。 $\sum^k_{i=1}λ_iG_i$

使用构造性的方法求得单纯矩阵的谱分解：略。

谱分解的意义：矩阵的函数可转化为特征值的函数和谱阵的乘积和，即 $\sum^k_{i=1}f(λ_i)G_i$

幂等阵的几何意义：幂等阵和投影阵一一对应。因为一次投影变换之后，继续投影变换结果不变。

特殊的，幂等酉对称阵的几何意义是正交投影变换。即投影不正交，等价于幂等阵不对称。

由正规矩阵是单纯矩阵的加强，故正规矩阵的谱分解过程可以进一步简化。

三、矩阵的广义逆

3.1 广义逆矩阵

我们希望将逆矩阵的概念推广到非奇异矩阵，而当矩阵退化为奇异矩阵时，其广义逆矩阵也退化为通常的逆矩阵。

广义逆矩阵需要满足一下的全部或部分性质：

$A X A = A$
$X A X = X$
$AX)^H = AX$
$XA)^H = XA$

共有15种广义逆，在这里，主要研究 A{1}，A{1,3}，A{1,4}，A{1,2,3,4}

3.2 广义逆矩阵 $A^+$

$A^+ = A{1,2,3,4}$ 存在且唯一。

可由 SVD 分解求得 $A^+$ ， $A = VSU^H，A^+ = US^{-1}V^H$

$A^+$ 有很多和 $A^-$ 类似的性质。

3.3 $A^+$ 的几种基本求法

满秩分解求 $A^+$
- 特殊的，列满秩时， $A^+ = (A^HA)^{-1}A^H$
- 特殊的，行满秩时， $A^+ = A^H(AA^H)^{-1}$
奇异值分解求 $A^+$
- 特殊的，可以只分解出酉高矩阵 $U_1$ ，对求解过程进行简化， $A^+ = U_1S^{-1}U_1^HA^H$
谱分解求 $A^+$
- Sylvester 公式，不失为一种求解方法，但是计算量较大