线性代数(22)——矩阵SVD分解

最新推荐文章于 2022-10-03 23:03:57 发布

Jakob_Hu

最新推荐文章于 2022-10-03 23:03:57 发布

阅读量3.9k

点赞数 2

分类专栏：线性代数

本文链接：https://blog.csdn.net/Jakob_Hu/article/details/91841729

版权

线性代数同时被 2 个专栏收录

22 篇文章 18 订阅

订阅专栏

线性代数

20 篇文章 10 订阅

订阅专栏

矩阵SVD分解

对称矩阵
- 概念
- 对称矩阵性质
正交对角化
奇异值
- 概念
- 奇异值几何意义
矩阵SVD分解

对称矩阵

借助对称矩阵可以处理任何矩阵，将任何矩阵都分解成希望的形式。

概念

对称矩阵中所有元素沿主对角线对称，主对角线元素不要求实相同的。用数学语言表述为 $A=A^T$ 。对称矩阵也一定是方阵。

对称矩阵性质

对称矩阵的特征值一定是实数
对称矩阵出现多重特征值时，其几何重数一定等于代数重数。也就意味着对称矩阵一定有 $n$ 个线性无关的特征向量。
对称矩阵一定可以被对角化。这实际上与上一条性质等价。

在之前的笔记中，特征值和特征向量的计算过程涉及到几何重数是否等于代数重数、 $n$ 个特征向量是否线性无关等判断。而在面对对称矩阵时，这些运算都可以免去。也就是说，对称矩阵减去了先前特征值计算过程中的各类复杂情况。

正交对角化

对称矩阵一定可以被正交对角化

正交对角化是对称矩阵另一个良好的性质，对称矩阵的所有的不同的特征值对应的特征向量相互垂直。

对上面的性质进行证明，
在这里插入图片描述
对于对称矩阵具有多重特征值的情况，因为对称矩阵几何重数等于代数重数， $k$ 重相同特征值的特征空间也是 $k$ 维，所以在这个空间中找到 $k$ 个正交基是没有问题的。

也就是说对称矩阵一定可以被正交对角化。

其中 $Q$ 是标准正交矩阵， $Q$ 矩阵也同样具有良好的性质， $Q^{-1}=Q^T$ ，所以对称矩阵一定满足 $A= QDQ^T$ ，这也称为对矩阵 $A$ 进行了正交对角化。实际上就是在保证了对角化的基础上，同时满足矩阵 $P$ 是一个标准正交矩阵。

如果一个矩阵能够被正交对角化，则它一定是对称矩阵

对该性质进行证明，
在这里插入图片描述

谱定理

实际上就是上面的两个互为充要的条件，因为在有些地方矩阵的特征值或奇异值称为谱。
在这里插入图片描述

奇异值

之前讨论的特征值、特征向量、相似型、对角化、对称矩阵和正交对角化的内容都是针对方阵而言的。但是在实际工作中，大部分的数据都是非方阵的。若 $A$ 是一个 $m \times n$ 的矩阵，则 $A^TA$ 是一个 $n \times n$ 的方阵，且该方阵是对称矩阵。

对上面的结论进行证明，
在这里插入图片描述
由此，所有的对阵矩阵的良好性质都能够应用。即 $A^TA$ 可以被正交对角化，拥有 $n$ 个实数特征值，且相应的特征向量线性无关。

概念

基于上面得证的 $A^TA$ 的性质，进行下面的一步操作，目前先不考虑这样操作的原因，具体原因会在后面说明，
在这里插入图片描述
这就将 $A$ 和 $A^TA$ 的特征值和特征向量之间建立联系，因为 $||A\vec{v_i}||^2$ 是模的平方，所以 $A^TA$ 的特征值一定是 $\geq 0$ 的，

奇异值(singular value)， $\sigma_i=\sqrt{\lambda_i}$ ，就是 $A\vec{v_i}$ 对应的向量的长度。

一般情况下，计算得到的奇异值按照从大到小的顺序进行排序。

奇异值几何意义

$\{A\vec{v_i}\}$ 是 $A$ 的列空间的一组正交基，同时满足特征向量 $\vec{v_i}$ 对应的特征值 $λ_i ≠ 0$ 。对这一结论进行证明分成两部分，

证明 $A\vec{v_i}$ 之间的正交性
证明 $A\vec{v_i}$ 构成 $A$ 的列空间的正交基

当 $λ_i$ 等于0时， $A\vec{v_i}$ 对应的向量就是一个零向量，相应的奇异值也为0。如果矩阵 $A$ 有 $r$ 个不为0的奇异值，则 $\{ A\vec{v_1}, A\vec{v_2}, ……, A\vec{v_r} \}$ 是矩阵 $A$ 的列空间的一组正交基。 $A$ 的列空间的维度为 $r$ ，即 $A$ 矩阵的秩 $r a n k (A) = r$ 。 $\{ \frac{A\vec{v_1}}{σ_1}, \frac{A\vec{v_2}}{σ_2}, ……, \frac{A\vec{v_r}}{σ_r} \}$ 是矩阵 $A$ 的列空间的一组标准正交基。

矩阵SVD分解

这是矩阵最重要的分解形式。SVD分解的全称为“Singular Value Decomposition”，即通过矩阵的奇异值进行分解。SVD分解的优势在于，该方法对矩阵没有任何限制，对于任意形状的矩阵都适用。

SVD分解

SVD分解将矩阵分为三部分
在这里插入图片描述
矩阵U和V都是标准正交矩阵。

唯一不是方阵的 $\sum$ 比较特殊，
在这里插入图片描述

证明SVD分解成立

结合SVD分解的公式，因为U和V都是标准正交矩阵，依据标准正交矩阵的性质 $V^T = V^{-1}$ 。
在这里插入图片描述

SVD分解过程

对于一个 $m \times n$ 的矩阵 $A$ ，进行SVD分解的步骤如下，

求解对称矩阵 $A^TA$ 的特征值和特征向量
用所有非零的特征值得到所有非零的奇异值 $m \times n$ 的 $\sum$ ， $\sum$ 中对角线上的奇异值按照从大到小的顺序进行排列
将所有特征向量标准化后得到 $n \times n$ 的矩阵 $V$
使用 $A^TA$ 这个矩阵所有 $r$ 个不为0的特征值及其对应的 $r$ 个非零特征向量求取 $U$ 矩阵的列向量 $\vec{u_i}$ ，其中 $\vec{ui}=\frac{A\vec{v_i}}{σ_i}$ 。如果 $r < m$ ，则使用Gram-Schmidt方法对 $\vec{u_i}$ 进行扩充，最终得到 $m$ 维空间的一组正交基。

实现矩阵SVD分解

使用Scipy模块实现SVD分解，

import numpy as np
from scipy.linalg import svd

if __name__ == "__main__":
    A = np.array([[1, 2],
                  [3, 4],
                  [5, 6]])
    U, s, VT = svd(A)
    print(U)    # 3×3的矩阵
    print(s)    # 返回一个一维向量，其中每个元素都是矩阵A^(T)A的奇异值
    print(VT)    # 2×2的矩阵

    # 先创建 ∑ 矩阵
    Sigma = np.zeros(A.shape)
    for i in range(len(s)):    
        Sigma[i][i] = s[i]

    print(U.dot(Sigma).dot(VT))    # 与A矩阵相同

SVD分解的用途

SVD分解使用很广泛，几乎在使用线性代数的地方都脱离不开SVD分解。举例说明，

将矩阵 $A$ 看做变换
将 $U$ 和 $V$ 看做是 $m$ 维和 $n$ 维空间的标准正交基。若向量 $\vec{x}$ 是 $V$ 矩阵所在空间的向量，则向量 $\vec{x}$ 可以被矩阵 $V$ 中的列向量表示。

对上面最后一行式子进行说明， $A$ 矩阵的变换被放在 $U$ 这个坐标系下看，与此同时变换结果的值是在之前 $U$ 坐标系中的值的基础上拉伸奇异值倍。
将奇异值视为权值

对上式进行整理可以得到，

所以SVD可以对原始数据进行压缩、降维、去噪(奇异值很小的数据可以视为噪音)。上式表示将 $A$ 这个 $m \times n$ 的数据，看做是一个 $r$ 维的数据，其中( $r < = m i n (m, n)$ )。

SVD在图像领域的应用很广泛，利用SVD分解，减少了一定的数据量但是依旧可以很好的表达图像的语义。

Jakob_Hu

关注

2
点赞
踩
21

收藏

觉得还不错? 一键收藏
0
评论
线性代数(22)——矩阵SVD分解

矩阵SVD分解对称矩阵概念对称矩阵性质正交对角化对称矩阵一定可以被正交对角化如果一个矩阵能够被正交对角化，则它一定是对称矩阵谱定理奇异值概念奇异值几何意义对称矩阵借助对称矩阵可以处理任何矩阵，将任何矩阵都分解成希望的形式。概念对称矩阵中所有元素沿主对角线对称，主对角线元素不要求实相同的。用数学语言表述为A=ATA=A^TA=AT。对称矩阵也一定是方阵。对称矩阵性质对称矩阵的特征值一定...
复制链接

扫一扫

专栏目录