线性代数学习笔记10-3：奇异值分解SVD（从四个子空间角度理解）、瘦奇异值分解（thin SVD）

Insomnia_X

已于 2024-01-05 16:24:30 修改

阅读量1.4k

点赞数 2

分类专栏：线性代数学习笔记文章标签：线性代数学习

于 2022-11-30 13:38:28 首次发布

本文链接：https://blog.csdn.net/Insomnia_X/article/details/128113516

版权

线性代数学习笔记专栏收录该内容

43 篇文章 98 订阅

订阅专栏

本文详细阐述了SVD（奇异值分解）通过四个子空间——行空间、零空间、列空间和左零空间来理解线性变换。它展示了标准正交基的选择，以及如何通过SVD实现数据的降维和特征值分析。特别强调了瘦SVD的结构，以及SVD与矩阵运算的理论统一。

摘要由CSDN通过智能技术生成

从四个子空间角度理解SVD

$\mathbf {A =U_{m \times m}\Sigma_{m \times n}V_{n \times n}^H}$
在这里插入图片描述
将 $\mathbf {A}$ 视为线性变换，并将整个 $\mathbf R^n$ 空间拆分为两部分，即 $\mathbf {A}$ 的行空间（维数 $r$ ）和零空间（维数 $n - r$ ，行空间的正交补）：

$\mathbf {A}$ 的行空间中，存在第一部分标准正交基 $\mathbf{v}_{i}(i=1,2,...,r)$
$\mathbf A$ 对应的线性变换将行空间中的 $\mathbf{v}_{i}$ 映射为 $\mathbf A$ 的列空间中的一个非零向量 $\sigma_i\mathbf u_i=\mathbf A\mathbf{v}_{i}$ （视为对 $\mathbf A$ 的列向量的线性组合）；
$\begin{aligned}\boldsymbol{A}\left[\begin{array}{llll}\mathbf{v}_{1} & \mathbf{v}_{2} & \cdots & \mathbf{v}_{r}\end{array}\right] &=\left[\begin{array}{lllll} \sigma_{1} \mathbf{u}_{1} & \sigma_{2} \mathbf{u}_{2} & \cdots & \sigma_{r} \mathbf{u}_{r} \end{array}\right] \\ &=\left[\begin{array}{lllll} \mathbf{u}_{1} & \mathbf{u}_{2} & \cdots & \mathbf{u}_{r} \end{array}\right]\left[\begin{array}{llll} \sigma_{1} & & & \\ & \sigma_{2} & & \\ & & \ddots & \\ & & & \sigma_{r} \end{array}\right] \end{aligned}$
此即 $\mathbf U_{m\times n}\hat{\mathbf V}_{n\times r}=\hat{\mathbf U}_{m\times r}\hat{\mathbf \Sigma}_{r\times r}$ ，对应下图中的红色边框部分

注意， $\mathbf A$ 的行空间中的向量 $\mathbf x$ 到列空间中的向量 $\mathbf A\mathbf x$ 映射，为一一映射
也就是说对于行空间中的向量 $\mathbf x\neq\mathbf y$ ，则必有列空间中的向量 $\mathbf A\mathbf x\neq\mathbf A\mathbf y$
证明：
反证法：对于行空间的向量 $\mathbf x\neq\mathbf y$ ，假设有 $\mathbf A\mathbf x=\mathbf A\mathbf y$
则 $\mathbf A(\mathbf x-\mathbf y)=\mathbf 0$ ，这就是说，向量 $(\mathbf x-\mathbf y)$ 在零空间中；
另一方面，向量 $(\mathbf x-\mathbf y)$ 一定在行空间中（两个行空间中的向量的线性组合）
向量 $(\mathbf x-\mathbf y)$ 不可能既在行空间中，又在零空间中，因此假设不成立

在这里插入图片描述

$\mathbf A$ 的零空间中，有第二部分标准正交基 $\mathbf v_i(i=r+1,r+2,...,n)$
$\mathbf A$ 对应的线性变换将 $\mathbf v_i$ 映射为零向量，满足 $\mathbf {A}\mathbf v_i=0$ ；
体现在 $\boldsymbol{\Sigma}_{m\times n}$ 中，就是其右下角的0元素，对应上图蓝色边框部分

上面是从 $\mathbf {A =U\Sigma V^H}\Rightarrow \mathbf {A V =U\Sigma}$ 的角度出发；
从 $\mathbf {A^H =V\Sigma^HU^H}\Rightarrow \mathbf {A^HU =V\Sigma^H}$ 的角度同理可知： $\mathbf U$ 给出了 $\mathbf A^H$ 的行空间和零空间的标准正交基

结论

我们在 $\boldsymbol{A}$ 的四个子空间中，寻找了两组合适的基：

第一组是 $\mathbb C^{n\times n}$ 空间中的标准正交基，由两部分构成：
$\mathbf{v}_{i}(i=1,2,...,r)$ 为行空间中的 $r$ 个标准正交基
$\mathbf{v}_{i}(i=r+1,r+2,...,n)$ 为零空间中的标准正交基
第二组是 $\mathbb C^{m\times m}$ 空间中的标准正交基，由两部分构成：
$\mathbf{u}_{i}(i=1,2,...,r)$ 为列空间中的 $r$ 个标标准正交基
$\mathbf{u}_{i}(i=r+1,r+2,...,m)$ 为左零空间中的标准正交基

瘦奇异值分解（thin SVD）

$\mathbb V^m$ 空间的一组正交基是 $U=\begin{bmatrix} U_r&U_{m-r} \end{bmatrix}=\begin{bmatrix} \mathbf{u}_1&\cdots&\mathbf{u}_r~\vert~\mathbf{u}_{r+1}&\cdots&\mathbf{u}_m \end{bmatrix}$
$\mathbb V^n$ 空间的一组正交基是 $V=\begin{bmatrix} V_r&V_{n-r} \end{bmatrix}=\begin{bmatrix} \mathbf{v}_1&\cdots&\mathbf{v}_r~\vert~\mathbf{v}_{r+1}&\cdots&\mathbf{v}_n \end{bmatrix}$
对应了四个子空间：
$\begin{aligned} A\mathbf{v}_i&=\sigma_i\mathbf{u}_i,~~~i=1,\ldots,r\\ A\mathbf{v}_i&=\mathbf{0}_i,~~~i=r+1,\ldots,n\\ A^H\mathbf{u}_i&=\sigma_i\mathbf{v}_i,~~~i=1,\ldots,r\\ A^H\mathbf{u}_i&=\mathbf{0},~~~i=r+1,\ldots,m,\end{aligned}$

实际上其中的 $n - r$ 个 $\mathbf{v}_i$ 和 $m - r$ 个 $\mathbf{u}_i$ 是“多余”的
因为只要求它们被映射为零向量（而不要求有 $\mathbf A\mathbf{v}_i=\sigma_i\mathbf{u}_i$ 的一一映射关系），或者说线性变换 $\mathbf A$ 并未对这些向量进行实质性的操作（ $\mathbf A$ 将多余的 $\mathbf{v}_i$ 降维压缩为零向量，而 $\mathbf{u}_i$ 则是那些线性变换后的新空间中与变换本身无关的多余维度）

从关注线性变换 $\mathbf A$ 的本质的角度，我们完全可以忽略零空间和左零空间，只关注行空间和列空间之间的一一映射
那么，有 $A$ 的瘦奇异值分解（thin SVD）如下： $\begin{aligned} A&=\begin{bmatrix} U_r&U_{m-r} \end{bmatrix}\begin{bmatrix} D&0\\ 0&0 \end{bmatrix}\begin{bmatrix} V_r^H\\ V_{n-r}^H \end{bmatrix}=U_rDV_r^H\\ &=\begin{bmatrix} \mathbf{u}_1&\cdots&\mathbf{u}_r \end{bmatrix}\begin{bmatrix} \sigma_1&&\\ &\ddots&\\ &&\sigma_r \end{bmatrix}\begin{bmatrix} \mathbf{v}_1^H\\ \vdots\\ \mathbf{v}_r^H \end{bmatrix}\\ &=\sigma_1\mathbf{u}_1\mathbf{v}_1^H+\cdots+\sigma_r\mathbf{u}_r\mathbf{v}_r^H,\end{aligned}$

理论的统一

前面笔记10-1说过，SVD（ $\boldsymbol{A} =\boldsymbol{U} \boldsymbol{\Sigma} \boldsymbol{V}^{T}$ ）中， $\boldsymbol{\Sigma}$ 奇异值 $\sigma\geq 0$ ；

若 $\boldsymbol{A}$ 为可逆矩阵 $r = n$ ，没有0特征值，
则 $\boldsymbol{A}^{T} \boldsymbol{A}$ 和 $\boldsymbol{A}\boldsymbol{A}^{T}$ 特征值全为正，为正定矩阵，对应 $\boldsymbol{A}$ 奇异值全为正；
若 $\boldsymbol{A}$ 为不可逆矩阵 $r < n$ ，有0特征值，
则 $\boldsymbol{A}^{T} \boldsymbol{A}$ 和 $\boldsymbol{A}\boldsymbol{A}^{T}$ 特征值正数和0，为半正定矩阵，对应 $\boldsymbol{A}$ 奇异值为正数和0

因此有：
$\boldsymbol{A}$ 不可逆（ $r < n$ ） $\iff$
$\boldsymbol{\Sigma}$ 对角元为正数和0（存在奇异值为0） $\iff$
$\boldsymbol{A}$ 存在零空间（维度 $n - r > 0$ ），零空间中的一部分向量 $\mathbf v_i$ 被线性变换 $\boldsymbol{A}$ 映射为零向量（ $\boldsymbol{A}\mathbf v_i=0$ ） $\iff$
$\bold{Ax=0}$ 有非零解 $\iff$
$\boldsymbol{A}$ 的列向量组线性相关

Insomnia_X

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
线性代数学习笔记10-3：奇异值分解SVD（从四个子空间角度理解）、瘦奇异值分解（thin SVD）

不可能既在行空间中，又在零空间中，因此假设不成立。一定在行空间中（两个行空间中的向量的线性组合）中，就是其右下角的0元素，对应上图蓝色部分。为半正定矩阵，其特征值正数和0，对应。为正定矩阵，其特征值全为正，对应。前面笔记10-1说过，SVD（也就是说对于行空间中的向量。反证法：对于行空间的向量。，则必有列空间中的向量。
复制链接

扫一扫

专栏目录