[笔记][总结] MIT线性代数 Gilbert Strang 广义逆

最新推荐文章于 2021-08-25 23:08:24 发布

TZR986981442

最新推荐文章于 2021-08-25 23:08:24 发布

阅读量463

点赞数

分类专栏： MIT线性代数 Gilbert Strang 文章标签：线性代数

本文链接：https://blog.csdn.net/TZR986981442/article/details/104777713

版权

MIT线性代数 Gilbert Strang 专栏收录该内容

10 篇文章 5 订阅

订阅专栏

作者水平有限，欢迎大家提出文中错误

左逆，右逆和伪逆

四个基本子空间的图像
广义逆的含义
从可逆矩阵的逆说起
左逆
右逆
伪逆
- 奇异值分解的进一步探讨
- 从线性变换的角度来看，伪逆代表了什么

四个基本子空间的图像

矩阵 $A_{m*n}$ ，描述了线性变换 $T(*):\ \real^n\rightarrow\real^m$ （只考虑矩阵右乘）

$T$ 有一个特性： ${\forall}\ v\ {\in}\ C(A),\ T(v)=w,\ then\ w\in{C(A^T)}$ ，并且在 $C (A)$ 与 $C(A^T)$ 上， $T$ 是一个双射，也就是说 $\exists\ T^{-1}:\real^m\rightarrow\real^n,T^{-1}(w)=v$

证明：
假设已有 $A v = w$ 且 $w\not=0$ （因为 $v{\notin}N(A)$ ），若又有 $A x = w$ ，则 $A (v - x) = 0$ ，所以说 $v = w$ ，单射证毕。
$\forall\ w\in C(A^T),\ \exist\ v\in C(A),Ax=w$ ，满射证毕。
至此，已经对这四个基本子空间有个如下了解

$dim\ C(A)=dim\ C(A^T)=r$
$dim\ N(A)=n-r,\ dim\ N(A^T)=m-r$
$C (A)$ 中的向量和 $C(A^T)$ 中的向量存在唯一对应的关系。
$N(A)\subseteq \mathbb R^n,\ C(A^T)\subseteq\mathbb R^n$ ， $N(A^T)\subseteq \mathbb R^m,\ C(A)\subseteq \mathbb R^m$

一个列满秩的矩阵 $A_{3*2}$ （ $rank\ A=2$ ）
在这里插入图片描述
秩为1的矩阵 $A_{3*2}$

广义逆的含义

上一节得出了一个重要结论，矩阵 $A$ 描述了一个线性变换 $T$ ，如果将像空间限制在 $C (A)$ ，原像空间限制在 $C(A^T)$ ，那么 $T$ 是双射。双射意味着像空间和原像空间的所有元素间都存在这逐一对应关系，所以对于矩阵 $A$ ，我们总能找到矩阵 $A^+$ ，其描述的线性变换可以使像空间 $C (A)$ 的元素映射回原像空间 $C(A^T)$ 。

从可逆矩阵的逆说起

只有可逆矩阵的逆才满足
$AA^{-1}=A^{-1}A=I$
此时 $r=m=n,full\ rank$

左逆

$r=n<m,full\ column\ rank$ ，此时零空间 $N(A)=\{0\}$
在最小二乘法中知道， $A^TA$ 满秩，所以存在
$A^TA)^{-1}A^TA=I$
其中 $A^TA)^{-1}A^T$ ，被称为列满秩矩阵 $A$ 的左逆
$A_{left\ n*m}^{-1}A_{m*n}=I_{n*n}$
如果把列满秩的矩阵 $A$ 的左逆放在 $A$ 的右边
$A_{m*n}A_{left\ n*m}^{-1}=A(A^TA)^{-1}A^T$
为列空间投影矩阵

右逆

$r=m<n,full\ row\ rank$ ，此时左零空间 $N(A^T)=\{0\}$
此时 $AA^T$ 是可逆的
$AA^T(AA^T)^{-1}=I$
其中 $A^T(AA^T)^{-1}$ ，被称为行满秩矩阵 $A$ 的右逆
$A_{m*n}A^{-1}_{right\ n*m}=I_{m*m}$
如果把行满秩的矩阵 $A$ 的右逆放在 $A$ 的左边
$A_{right\ n*m}^{-1}A_{m*n}=A^T(AA^T)^{-1}A$
为行空间投影矩阵

伪逆

如果不保证行满秩也不保证列满秩 $r < m, r < n$ ，那么 $AA^T$ 和 $A^TA$ 都有可能是奇异的，那么这时候，左逆和右逆就都不存在。
伪逆是存在的，正如文章一开头所说，如果将像空间和原像空间限制在列空间和行空间，那么任意矩阵 $A$ 所代表的线性变换，都是可逆的

奇异值分解的进一步探讨

$\left[ \begin{matrix} \Sigma&O\\ O&O\\ \end{matrix} \right] V^T$
先来看
$\left[ \begin{matrix} \Sigma&O\\ O&O\\ \end{matrix} \right]$
如果它是方阵，其伪逆是将非零对角元全取倒数得到的对角阵
$\left[ \begin{matrix} \sigma_1&&&&&&\\ &\sigma_2&&&&&\\ &&\ddots&&&&\\ &&&\sigma_r&&&\\ &&&&0&&\\ &&&&&\ddots&\\ &&&&&&0\\ \end{matrix} \right] \left[ \begin{matrix} 1/\sigma_1&&&&&&\\ &1/\sigma_2&&&&&\\ &&\ddots&&&&\\ &&&1/\sigma_r&&&\\ &&&&0&&\\ &&&&&\ddots&\\ &&&&&&0\\ \end{matrix} \right]=$
$\left[ \begin{matrix} 1&&&&&&\\ &1&&&&&\\ &&\ddots&&&&\\ &&&1&&&\\ &&&&0&&\\ &&&&&\ddots&\\ &&&&&&0\\ \end{matrix} \right]$
对于一般情况
$\left[ \begin{matrix} I_{r*r}&O\\ O&O\\ \end{matrix} \right]_{n*n}= \left[ \begin{matrix} \Sigma^{-1}&O\\ O&O\\ \end{matrix} \right]_{n*m} \left[ \begin{matrix} \Sigma&O\\ O&O\\ \end{matrix} \right]_{m*n}$
$\left[ \begin{matrix} I_{r*r}&O\\ O&O\\ \end{matrix} \right]_{m*m}= \left[ \begin{matrix} \Sigma&O\\ O&O\\ \end{matrix} \right]_{m*n} \left[ \begin{matrix} \Sigma^{-1}&O\\ O&O\\ \end{matrix} \right]_{n*m}$
可见伪逆的左乘和右乘，得到的“单位矩阵”并不相同，左乘，得到的是向行空间的投影；右乘，得到的是向列空间的投影。

对于矩阵 $A$ ，记其伪逆为 $A^+$
$A^+=V_{n*n} \left[ \begin{matrix} \Sigma^{-1}&O\\ O&O\\ \end{matrix} \right]_{n*m}U_{m*m}$

从线性变换的角度来看，伪逆代表了什么

已经知道 $A^+A$ 是行空间的单位投影矩阵， $AA^+$ 是列空间的单位投影矩阵
现在有一个向量 $v\in C(A^T)$ ，经过 $A$ 的线性变换后，只保留了 $r$ 维的信息，其余的 $n - r$ 维信息丢失了，被压缩成了零向量。
当 $A^+$ 想要尽力找到 $A v$ 的原像时，能做到的最多是把没有丢失的 $r$ 维信息进行恢复，被压缩成零向量的 $n - r$ 个维度已经无力回天。
$AA^+$ 也是同理， $A$ 只能尽力恢复左乘 $A^+$ 时还保留着的信息。

TZR986981442

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
[笔记][总结] MIT线性代数 Gilbert Strang 广义逆

奇异值分解的进一步探讨基本子空间的图像基本子空间的图像矩阵Am∗nA_{m*n}Am∗n，描述了线性变换T(∗): ℜn→ℜmT(*):\ \real^n\rightarrow\real^mT(∗): ℜn→ℜm（只考虑矩阵右乘）TTT有一个特性：∀ v ∈ C(A), T(v)=w, then w∈C(AT)...
复制链接

扫一扫