MIT 线性代数 Linear Algebra 17: 正交矩阵和Gram-Schmidt正交化手续

最新推荐文章于 2022-10-10 06:54:06 发布

Forforth

最新推荐文章于 2022-10-10 06:54:06 发布

阅读量447

点赞数

分类专栏： Linear Algebra

本文链接：https://blog.csdn.net/Lyn_S/article/details/108926574

版权

Linear Algebra 专栏收录该内容

29 篇文章 19 订阅

订阅专栏

之前我们已经探讨过正交向量和正交space并且探讨了怎么把一个vector投影到一个subspace里。在这一讲里，我们会强化之前的学习，特别的，我们讨论一类特别的矩阵：正交矩阵。当一个subspace的一组基选用正交矩阵时 (即，基之间两两正交且长度均为 1)，我们之前的计算将会被大大简化。这是正交矩阵带给我们的好处。

注意，正交矩阵我们叫orthogonal matrix 但是含义是他的列是orthonormal的。

什么是正交矩阵

正交矩阵 $\bm{Q}_{m\times n}$ 是拥有 orthonormal columns 的矩阵. 假设 $\bm{Q}_{m\times n}$ 的列是 $\bm{q_1}$ , $\bm{q_2}$ , …, $\bm{q_n}$ , 则
$\bm{q_i^\top q_j}=\begin{cases} 0 & \text{if}~i\neq j \\ 1 & \text{if}~i=j \end{cases}~~~~(1)$

实际上，正交矩阵的各列就是 $\mathbb{R}^m$ 空间中的一个subspace $\mathbb{R}^n$ 的一组 orthonormal bases。

正交矩阵有很好的性质：

$\bm{Q^\top Q=I_n}$ 这从矩阵乘法的定义和 (1) 中很容易看出。
当 $\bm{Q}$ 是一个方阵时， $\bm{Q}^{-1}=\bm{Q}^\top$

一个简单的例子是 permutation matrices，之前我们就说过 permutation matrix 的 inverse 很好求，就是他自己的转置。这背后的原因是，permutation matrices 本身是正交矩阵。因为它们是单位阵 row exchange 的结果。

正交矩阵带来了什么

好，接下来我们看下 how does the orthogonal matrix make our life easier. Prof. Strang 用的是之前 projection 课程中的例子。

我们之前讲过，如果把一个vector $\bm{b}$ 投影到矩阵 $\bm{A}$ 的column space上，投影矩阵 $\bm{P}$ 和投影后得到的vector $\bm{d}$ 为
$\bm{P}=\bm{A}(\bm{A}^\top\bm{A})^{-1}\bm{A}^\top$

$\bm{d}=\bm{A}(\bm{A}^\top\bm{A})^{-1}\bm{A}^\top\bm{b}$

现在，如果我们假设 $\bm{A}$ 是一个正交阵，即我们选取subspace的一组orthonormal basis 组成 $\bm{A=Q}$ ，则有
$\bm{P}=\bm{Q}\bm{Q}^\top$

$\bm{d}=\bm{Q}\bm{Q}^\top\bm{b}$

可以看出计算被大大简化了。而且 $\bm{Q}\bm{Q}^\top$ 确实是一个 projection
matrix，symmetric， $\bm{P}^i=\bm{P}$ 都是满足的。

注意此时 $\bm{Q}\bm{Q}^\top$ 没法继续化简了，除非 $\bm{Q}$ 是一个方阵 $\bm{Q}\bm{Q}^\top=\bm{I}$ 。这个结论显然正确，因为 $\bm{Q}$ 是一个方阵时，他的column space是整个空间，投影结果还是原来的 $\bm{d=b}$ .

怎样得到正交阵

正交阵确实很好，但是怎么得到正交阵尼？Gram and Schmidt 给出了下面两个processes 让我们从一个列满秩矩阵得到一个正交阵。

假设我们有一个列满秩矩阵 $[\bm{a_1},\bm{a_2}, ..., \bm{a_n}]^\top$ 其中 $\bm{a_i}$ 是各列.

首先，我们尝试得到一组正交的向量 $\bm{A_1},\bm{A_2}, ..., \bm{A_n}$ .
然后我们直接对正交向量归一化即可
$\bm{q_i}=\bm{A_n}/\|\bm{A_n}\|$

这些 $\bm{q_i}$ 便是我们target vectors。

好，难点其实在第一步，怎么由 $\bm{a_1},\bm{a_2}, ..., \bm{a_n}$ 得到 $\bm{A_1},\bm{A_2}, ..., \bm{A_n}$ 。

$\bm{a_1}$ 方向我们不动 $\bm{A_1=a_1}$ ，从他开始构造其他向量。
$\bm{a_2}$ 的构造方法其实就是把 $\bm{a_2}$ 投影到 $\bm{a_1}$ 上，只不过我们不要投影后的向量 $\bm{d}$ , 而是要法向量 $\bm{A_2=e=a_2-d}$ , 因为法向量是和 $a_1$ 正交的。
$\bm{A_2}=\bm{a_2} - \frac{\bm{A_1}\bm{A_1}^\top}{\bm{A_1}^\top\bm{A_1}}\bm{a_2}=\bm{a_2} - \bm{A_1}\frac{\bm{A_1}^\top\bm{a_2}}{\bm{A_1}^\top\bm{A_1}}$
$\bm{a_3}$ 的构造那就是投影到 $\bm{A_1}$ , $\bm{A_2}$ 确定的 subspace 上，直接给出公式
$\bm{A_3}=\bm{a_3} - \bm{A_1}\frac{\bm{A_1}^\top\bm{a_3}}{\bm{A_1}^\top\bm{A_1}} -\bm{A_2}\frac{\bm{A_2}^\top\bm{a_3}}{\bm{A_2}^\top\bm{A_2}}$

and so on so forth 就能得到一组 $\bm{A_1},\bm{A_2}, ..., \bm{A_n}$ 。

QR 分解

实际上 Gram-Schimdt process 是一个把列满秩矩阵 QR 分解的过程。

QR分解是说，任意一个实数方阵都能被分解为一个正交阵乘以上三角矩阵的形式 (非方阵和非实数情况也能QR分解，这里不详细讨论)。
$A = Q R$

Gram-Schimdt process 能把一个列满秩矩阵变为正交阵，所以用 Gram-Schimdt process只能处理满秩矩阵的QR分解。

Forforth

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
MIT 线性代数 Linear Algebra 17: 正交矩阵和Gram-Schmidt正交化手续

orthonormal matrices QQ⊤QQ^\top QQ⊤Qwhy we would like to study orthonormal matricesmake life easy for projection matricesQQ⊤Q Q^\topQQ⊤How to transform a full column rank matrix to a orthonormal matrices.Gram-SchimdtQR 分解
复制链接

扫一扫