17. 正交矩阵和schmidt正交化

取个名字真难呐

已于 2024-05-19 20:20:24 修改

阅读量881

点赞数 14

文章标签：矩阵线性代数

于 2024-05-16 22:10:24 首次发布

本文链接：https://blog.csdn.net/scar2016/article/details/138975212

版权

文章目录

1. 标准正交基
2. 正交矩阵
3. 线性回归
4. Gram-Schmidt 正交化

1. 标准正交基

标准正交基是长度均1的基向量，在子空间中所有标准正交基均互相垂直，即它们的点积为0。
长度为 1 的向量 $q_1,q_2,\dots,q_n$ ，满足如下等式，表示为标准正交基：
$\begin{equation} q_i^Tq_j=\left\{ \begin{array}{ll} 0, &i \neq j \\ 1.&i=j\\ \end{array}, \quad ||q_i||=1 \right. \end{equation}$

标准正交基是为什么会让计算变得更好
假设我们有矩阵Q是n行n列情况下，矩阵Q里面包含n个标准正交基 $q_i$ ,表示如下：
$\begin{equation} Q=\begin{bmatrix} q_1&q_2&\dots&q_n \end{bmatrix},Q^T=\begin{bmatrix} q_1^T\\\\q_2^T\\\\\vdots\\\\q_n^T \end{bmatrix},Q^TQ=I \end{equation}$
我们记得对于矩阵A来说，我们想把向量b投影到矩阵A的列空间中，可以组建一个投影矩阵P
$\begin{equation} P=A(A^TA)^{-1}A^T \end{equation}$
我们将标准正交矩阵Q来代替A，整理可得：
$\begin{equation} P=Q(Q^TQ)^{-1}Q^T=QQ^T \end{equation}$
如果矩阵Q是方阵，并且满足 $Q^TQ=I$ ,那么可得 $Q^T=Q^{-1}$
置换矩阵M
$\begin{equation} M=\begin{bmatrix}0&0&1\\\\1&0&0\\\\0&1&0\end{bmatrix};M^{-1}=\begin{bmatrix}0&1&0\\\\0&0&1\\\\1&0&0\end{bmatrix}=M^T; \end{equation}$
旋转矩阵R
$\begin{equation} R=\begin{bmatrix}\cos{\theta}&-\sin{\theta}\\\\\sin{\theta}&\cos{\theta}\end{bmatrix};R^{-1}=\begin{bmatrix}\cos{\theta}&\sin{\theta}\\\\-\sin{\theta}&\cos{\theta}\end{bmatrix}=R^T; \end{equation}$
当 $\theta=-\frac{\pi}{4},R^{-1}=\frac{1}{\sqrt{2}}\begin{bmatrix}1&1\\\\1&-1\end{bmatrix};$
哈达玛矩阵H
$\begin{equation} H=\frac{1}{2}\begin{bmatrix}1&1&1&1\\\\1&-1&1&-1\\\\1&1&-1&-1\\\\1&-1&-1&1\end{bmatrix} \end{equation}$

2. 正交矩阵

假设我们有一个标准正交矩阵Q，表示如下：
$\begin{equation} Q=\frac{1}{3}\begin{bmatrix}1&-2&2\\\\2&-1&-2\\\\2&2&1\end{bmatrix} \end{equation}$
我们想将矩阵投影到矩阵Q的列空间中，根据上节讲到的问题，假设Q满秩， $Q^TQ=I$ ,投影矩阵P表示如下：
$\begin{equation} P=A(A^TA)^{-1}A^T\Rightarrow P=Q(Q^TQ)^{-1}Q^T=QQ^T \end{equation}$

当Q时方阵，且Rank(Q)=n,可以得到 $Q^{-1}=Q^T$ ,那么投影矩阵 $P=QQ^{-1}=I$

3. 线性回归

当我们在解方程中，发现无法得到准确的解，我们需要将向量b投影到矩阵A的列空间中，从而得到近似解 $\hat{X}$ , 根据上节内容，可以得到最小二乘法，也就是线性回归方程，表示如下：
$\begin{equation} A^TA\hat{X}=A^Tb \end{equation}$

我们将矩阵A用正交矩阵Q代替,定义矩阵Rank(Q)=n，得到 $Q^TQ=I$ 可以得到如下方程：
$\begin{equation} Q^TQ\hat{X}=Q^Tb\Rightarrow \hat{X}=Q^Tb \end{equation}$
$\begin{equation} \hat{x_i}=q_i^Tb \end{equation}$
重点：在数学领域，当我们已知一组标准正交基，那么我们可以将向量b 通过上述式子，直接得到标准正交基中的近似解 $\hat{x_i}$ ,真是神奇！！！这样就会很简单的把一个复杂的求解过程，变换成简单的方式来得到近似解！！！！数学神奇！！！

4. Gram-Schmidt 正交化

Gram-Schmidt 的作用是将原本不垂直和不正交的向量a,b，转换后变成两个向量 $a_1,b_1$ ,并且使得 $a_1||=1,||b_1||=1$

4.1 求投影矩阵p

假设我们有两个向量a,b ，我们要求向量b 在向量a上的投影向量p；
在这里插入图片描述

向量p的长度|p|
$\begin{equation} a^Tb=|a|\cdot|b|\cdot\cos(\theta);\Rightarrow |p|=\frac{a^Tb}{|a|} \end{equation}$
向量p的方向单位向量 $p_0$
$\begin{equation} p_0=\frac{a}{|a|} \end{equation}$
那么投影矩阵p 表示如下, $a^Ta=|a|\cdot|a|$ ：
$\begin{equation} p=|p|p_0=\frac{a^Tb}{|a|}\frac{a}{|a|}=\frac{a^Tb}{a^Ta}a \end{equation}$
那么与向量a垂直的向量e 可以表示如下：
$\begin{equation} e=b-p=b-\frac{a^Tb}{a^Ta}a \end{equation}$
跟Gram-Schmidt 变换一样！
那我们来验证下是否e与向量a垂直
$\begin{equation} a^Te=a^T(b-\frac{a^Tb}{a^Ta}a)=a^Tb-\frac{a^Ta^Tb}{a^Ta}a \end{equation}$
由于 $a^Tb=b^Ta;$ 且为常数，可以放在任意位置
$\begin{equation} a^Te=a^Tb-\frac{a^Ta\cdot a^Tb}{a^Ta}=a^Tb-a^Tb=0 \end{equation}$
$\begin{equation} a\perp e \end{equation}$
求第三个正交向量c,那我们知道的是，我们只需要用向量c ，减去c在向量a上的分量，向量b上的分量即可
$\begin{equation} c = c-\frac{a^Tc}{a^Ta}a-\frac{b^Tc}{b^Tb}b \end{equation}$
验证是否满足垂直条件
$\begin{equation} a^Tc = a^Tc-\frac{a^Ta^Tc}{a^Ta}a-\frac{a^Tb^Tc}{b^Tb}b \end{equation}$
$\begin{equation} b^Tc = b^Tc-\frac{b^Ta^Tc}{a^Ta}a-\frac{b^Tb^Tc}{b^Tb}b \end{equation}$
$a^Tc,b^Tc$ 均为常数，可以任意调整位置，且 $a^Tb=b^Ta=0$
$\begin{equation} a^Tc = a^Tc-\frac{a^Ta}{a^Ta}a^Tc-\frac{a^Tb}{b^Tb}b^Tc=a^Tc-a^Tc-0=0 \end{equation}$
$\begin{equation} b^Tc =b^Tc-\frac{b^Ta}{a^Ta}a^Tc-\frac{b^Tb}{b^Tb}b^Tc=b^Tc-0-b^Tc=0 \end{equation}$
通过Gramd-Schmidt 变换后，新成立的向量a,b,c 均相互正交。
$\begin{equation} a\perp b \perp c \end{equation}$
最后就是将向量a,b,c 长度变为1
$\begin{equation} a=\frac{a}{||a||},b=\frac{b}{||b||},c=\frac{c}{||c||} \end{equation}$

4.2 Gramd-schmidt计算

假设我们有两个向量a,b 表示如下：
$\begin{equation} a=\begin{bmatrix}1\\\\1\\\\1 \end{bmatrix},b=\begin{bmatrix}1\\\\0\\\\2 \end{bmatrix},c=\begin{bmatrix}1\\\\2\\\\1 \end{bmatrix} \end{equation}$

计算正交后的a,b
$\begin{equation} a=a=\begin{bmatrix}1\\\\1\\\\1 \end{bmatrix},b=b-\frac{a^Tb}{a^Ta}a=\begin{bmatrix}0\\\\-1\\\\1 \end{bmatrix} \end{equation}$
计算正交后的c,这里的b 是正交后的b，重点！！！！
$\begin{equation} c=c-\frac{a^Tc}{a^Ta}a-\frac{b^Tc}{b^Tb}b=\begin{bmatrix}-\frac{1}{3}\\\\\frac{1}{6}\\\\\frac{1}{6} \end{bmatrix} \end{equation}$
$\begin{equation} q_1=\frac{a}{||a||}=\frac{1}{\sqrt{3}}\begin{bmatrix}1\\\\1\\\\1 \end{bmatrix},q_2=\frac{b}{||b||}=\frac{1}{\sqrt{2}}\begin{bmatrix}0\\\\-1\\\\1 \end{bmatrix};q_3=\frac{c}{||c||}=\frac{1}{\sqrt{6}}\begin{bmatrix}-2\\\\1\\\\1 \end{bmatrix} \end{equation}$

4.3 矩阵分解

在用行消元的过程中我们得到如下：

L为下三角矩阵，U为上三角矩阵
$\begin{equation} AX=LUX \end{equation}$
现在我们通过Gramd-Schmidt正交得到如下
Q为m行n列的标准正交向量组矩阵，R为n行n列的正线上的三角阵
$\begin{equation} A_{m\times n}X=Q_{m\times n}R_{n\times n}X \end{equation}$