矩阵分解方法概述

最新推荐文章于 2024-03-12 14:43:51 发布

NeverMoreH

最新推荐文章于 2024-03-12 14:43:51 发布

阅读量2.9k

点赞数

分类专栏：数学知识 # 线性代数文章标签：矩阵分解三角分解 SVD分解谱分解 QR分解

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ms961516792/article/details/107560262

版权

数学知识同时被 2 个专栏收录

17 篇文章 6 订阅

订阅专栏

13 篇文章 2 订阅

订阅专栏

简述矩阵分解

定义

把一个矩阵 $A$ 表示为多个矩阵连乘的形式。

作用

用更少的内存消耗，存储一样多信息。eg：稀疏矩阵分解为多个稠密矩阵。
提高计算速度。eg：小矩阵比大矩阵更容易求逆。
用于矩阵补全。eg：推荐系统中，填补评分矩阵中的空缺项；图像复原。
分解后的矩阵有一些实际的意义。

三角分解（LU分解、LR分解）

这部分可以参考我之前的博客，链接

必要条件

$A$ 可逆，即：满秩矩阵
$A$ 可以被前面的 $r (A)$ 行线性表示

定义

$A = L U = L R$

LU分解中， $L$ 是下三角矩阵
LR分解中， $L$ 是单位下三角矩阵（单位的意思是“对角线全为1”）
$U$ 或 $R$ 是上三角矩阵
三角分解本质上是高斯消元法的一种表达形式

步骤

通过对 $A$ 不断的左乘初等矩阵，对 $A$ 进行初等变换，使其变为上三角矩阵，那么得到的上三角矩阵即为 $U$ ，这些初等矩阵的逆即为 $L$ 。

eg： $E_3E_2E_1A=U => A=(E_3E_2E_1)^{-1}U$

作用

求 $A$ 的行列式 $∣ A ∣$ 时，转换为求解 $∣ L ∣ ∣ U ∣$ ，三角矩阵求解行列式只需计算对角元素。
求线性方程组 $A x = b$ 时，可将其转换为求解 $L y = b$ 和 $U x = y$ 的两个同规模问题，由于 $L$ 和 $U$ 都是三角矩阵，运算量小。
求 $A$ 的逆矩阵时， $A^{-1}=U^{-1}L^{-1}$ ，三角矩阵的逆可以通过矩阵分块的方法计算。

QR分解

这部分可以参考我之前的博客，链接

必要条件

$A$ 的所有列向量线性无关，即：列满秩，即：可逆。

定义

$A = Q R$

$Q$ 是 $A$ 的列向量的施密特标准正交化（正规正交矩阵）
$R$ 是 $A$ 的列向量在标准正交基下的坐标表（上三角矩阵）

步骤

对 $A$ 进行施密特标准正交化，得到 $Q$
由于 $Q$ 是正交矩阵， $Q^TQ=I$ ，则 $Q^TA=Q^TQR=R$ ，即： $R=Q^TA$

作用

求解矩阵 $A$ 的全部特征值，此方法被称为QR方法（前提：不存在绝对值相等的特征值），下面进行详细描述。

当 $A$ 为对称矩阵时：
①. 通过相似变换，将 $A$ 变换为三对角矩阵 $A_0$ （除主对角线、主对角线挨着的两条线，其他元素为零）；
②. 对 $A_0$ 进行QR分解，得到 $A_0=Q_0R_0$ ，令 $A_1=R_0Q_0$ ；
③. 对 $A_1$ 进行QR分解，得到 $A_1=Q_1R_1$ ，令 $A_2=R_1Q_1$ ；
④. 重复上述过程，得到 $A_k$ ，当 $A_k$ 趋于对角矩阵时，其特征值即为 $A_0$ 的特征值（因为 $A_{k+1}=R_k Q_k=Q_k^{-1} Q_k R_k Q_k = Q_k^{-1} A_k Q_k$ ）。
当 $A$ 不是对称矩阵时：
①. 通过HouseHolder变换，将 $A$ 变换为Hessenberg $A_0$ （上三角矩阵，左下零三角中紧贴主对角线的那条线上的元素均不为零），Hessenberg矩阵的QR分解一定是另一个Hessenberg矩阵乘以上三角矩阵；
②. 对 $A_0$ 进行QR分解，得到 $A_0=Q_0R_0$ ，令 $A_1=R_0Q_0$ ；
③. 对 $A_1$ 进行QR分解，得到 $A_1=Q_1R_1$ ，令 $A_2=R_1Q_1$ ；
④. 重复上述过程，得到 $A_k$ ，当 $A_k$ 趋于上三角矩阵时，其特征值即为 $A_0$ 的特征值。

特征值分解（谱分解，EVD分解）

必要条件

方阵

定义

$A=QDQ^{-1}$

当 $A$ 为 $n$ 阶方阵时（一般形式）， $A=QDQ^{-1}$ ， $Q$ 为 $n$ 阶方阵， $Q$ 的列向量 $q_i$ 为特征向量， $\{ \lambda_1, \lambda_2, ... , \lambda_n \}_{n \times n}$ ， $\lambda_1, \lambda_2, ... , \lambda_n$ 为特征值。
当 $A$ 为实对称矩阵时， $A=QDQ^{T}$ ， $Q$ 为正交阵（ $QQ^T=I$ ）。
当 $A$ 为复正规矩阵时， $A=UDU^{H}$ ， $U$ 为酉矩阵。

步骤

求 $A$ 的特征值和特征向量即可。

作用

求解 $A$ 的逆矩阵， $A^{-1}= {QDQ^{-1}}^{-1} =QD^{-1}Q^{-1}$ ，可以看出，只需求 $D^{-1}$ 即可求得 $A^{-1}$ ，而 $D$ 是对角矩阵，其逆矩阵只需将对角元素取倒数。
图像压缩。但是一般现实中，大多数图片不是方的，所以奇异值分解用的较多。

奇异值分解（SVD分解）

必要条件

无限制

定义

$A=UDV^H$

$A$ 为 $m$ 行 $n$ 列
$U$ 为 $m$ 阶酉矩阵
$V$ 为 $n$ 阶酉矩阵， $V^H$ 是 $V$ 的共轭转置
$\{ \sigma_1, \sigma_2, ... , \sigma_r, 0, ... ,0\}_{m \times n}$ ， $\sigma_1, \sigma_2, ... , \sigma_r$ 为奇异值。

步骤

计算 $AA^H$ 的特征值和标准正交特征向量，用向量组成矩阵 $U$ ；
计算 $A^HA$ 的特征值和标准正交特征向量，用向量组成矩阵 $V$ ；
使用特征值开根号得到奇异值，组成矩阵 $D$ 。

作用

奇异值相当于方阵中的特征值，一般对应于矩阵中的重要信息，奇异值越大，信息的重要性越大。
图像压缩。假设原图片为 $800 \times 600$ （忽略颜色通道）的矩阵 $A$ ，将其进行SVD分解，得到 $U$ 、 $D$ 和 $V$ 三个矩阵，我们可以很容易的通过分解后的三个矩阵还原图片。但是，当我们没有足够的存储空间时，我们可以仅保留奇异值较大的若干项（保留的奇异值越多，图片的还原程度越高），来还原一个近似的图像。
图像去噪。当图像中存在噪声时，我们可以假设较小的奇异值是由噪声引起的，将这些奇异值变为零，即可去除噪声。
主成分分析。
推荐系统。
语义索引LSI。

关注

0
点赞
踩
21

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。