25. 复习二

取个名字真难呐

已于 2024-05-22 06:00:49 修改

阅读量901

点赞数 10

文章标签：线性代数机器学习人工智能

于 2024-05-20 22:11:37 首次发布

本文链接：https://blog.csdn.net/scar2016/article/details/139074969

版权

文章目录

1. 正交矩阵
2. 向量投影
3. 差分方程
4. 直线拟合
5. Gram-Schmidt正交化
6. 矩阵A的行列式
7. 代数余子式
8. 特殊矩阵
- 8.1 求投影到 $A_3$ 列空间的投影矩阵P
- 8.2 求投影到 $A_4$ 列空间的投影矩阵P

1. 正交矩阵

如果有一组长度为1且相互正交的向量，并且按照列组合在一起的矩阵，就叫正交矩阵；

因为 $q_i$ 满足如下条件：
$\begin{equation} q_i^Tq_j=\left\{ \begin{array}{ll} 0, &i \neq j \\ 1.&i=j\\ \end{array}, \quad ||q_i||=1 \right. \end{equation}$
$\begin{equation} Q=\begin{bmatrix}q_1&q_2&\cdots&q_n\end{bmatrix};Q^TQ=I \end{equation}$

2. 向量投影

我们有一个列向量 $a = [2 , 1, 2 ]^T$ ，我们需要找到一个投影矩阵P，满足给定任意一个向量b，都能满足向量c=Pb在向量a所在的直线上？
在这里插入图片描述

方法1：向量法
$\begin{equation} a^Tb=|a||b|\cdot\cos(\theta)=|a||p| \end{equation}$
向量p可以表示为向量长度乘以方向
$\begin{equation} p=|p|\cdot\frac{a}{|a|}=\frac{a^Tb}{|a|}\cdot\frac{a}{|a|}=\frac{aa^T}{a^Ta}b \end{equation}$
我们可以得出投影矩阵P
$\begin{equation} p=Pb=\frac{aa^T}{a^Ta}b;P=\frac{aa^T}{a^Ta} \end{equation}$
将a向量带入可得：
$\begin{equation} P=\frac{1}{9}\begin{bmatrix}4&2&4\\\\2&1&2\\\\4&2&4\end{bmatrix} \end{equation}$
我们可以在不计算的情况下求特征值
求 $\lambda_1$
$\begin{equation} Pa=\frac{aa^T}{a^Ta}a=a\Rightarrow Pa=1\cdot a \Rightarrow \lambda_1=1,v_1=a \end{equation}$
求 $\lambda_2$ ，我们一定能找到一个向量垂直于P的列向量满足内积为0
$\begin{equation} Pe=0\cdot e=0\Rightarrow \lambda_2=0,v_2=e \end{equation}$
求 $\lambda_3$
$\begin{equation} \lambda_1+\lambda_2+\lambda_3=\frac{1}{9}(4+1+4)=1 \Rightarrow \lambda_3=0 \end{equation}$
综上所述，可以得到特征值：
$\begin{equation} \lambda_1=1；\lambda_2=0；\lambda_3=0； \end{equation}$
方法2：矩阵法

一般情况下，我们有方程 $A x = b$ ,但通常情况下，我们发现 b 不在A的列空间中，也就是说b无法由A的列向量线性组合。这时候我们一般需要将向量b投影到A的列空间中得到向量p,那么明显就能够通过A的列空间线性组合而来，这是我们就用 $\hat{x}$ 近似解来代替 x ,并满足如下：
$\begin{equation} p=A\hat{x} \end{equation}$
由图可得向量e垂直于整个A的列空间平面，e=b-p
$\begin{equation} e=b-p;a_i^Te=0 \end{equation}$
-用矩阵形式表示如下：
$\begin{equation} \begin{bmatrix}a_1^T\\\\a_2^T\\\\\vdots\\\\a_n^T\end{bmatrix}(b-p)=0;A^T(b-A\hat{x})=0 \end{equation}$
当 $A^TA$ 可逆时，整理方程可得：
$\begin{equation} A^TA\hat{x}=A^Tb \Rightarrow \hat{x}=(A^TA)^{-1}A^Tb \end{equation}$
那么投影向量p可以表示如下：
$\begin{equation} p=A\hat{x}=A(A^TA)^{-1}A^Tb \end{equation}$
那么可以得到投影矩阵P表示如下：
$\begin{equation} P=A(A^TA)^{-1}A^T \end{equation}$
-现在我们的A为列向量，那么可以整理得到：
$\begin{equation} P=a(a^Ta)^{-1}a^T=\frac{aa^T}{a^Ta}；跟上面的公式一致，真神奇！！！ \end{equation}$

3. 差分方程

假设我们有一个投影矩阵P，和一个差分方程，表示如下：
$\begin{equation} P=\frac{1}{9}\begin{bmatrix}4&2&4\\\\2&1&2\\\\4&2&4\end{bmatrix}；u_{k+1}=Pu_k;u_0=\begin{bmatrix}9\\\\9\\\\0\end{bmatrix};a=\begin{bmatrix}2\\\\1\\\\2\end{bmatrix}; \end{equation}$

我们可以递归得到 $u_1$
$\begin{equation} P=\frac{aa^T}{a^Ta};u_{k+1}=\frac{aa^T}{a^Ta}u;u_k=P^ku_0;P^k=P \end{equation}$
整理可得：
$\begin{equation} u_k=Pu_0=\frac{aa^T}{a^Ta}u_0=\frac{a^Tu_0}{a^Ta}a=3a=\begin{bmatrix}6\\\\3\\\\6\end{bmatrix}; \end{equation}$

4. 直线拟合

假设我们有如下点，需要用通过原点的直线去拟合直线，使得误差最小。
$\begin{equation} A=(1,4);B=(2,5);C=(3,8);Y=DX \end{equation}$

矩阵表达如下：
$\begin{equation} \begin{bmatrix} 1\\\\2\\\\3 \end{bmatrix}\begin{bmatrix} x_1\\\\x_2\\\\x_3 \end{bmatrix}=\begin{bmatrix} 4\\\\5\\\\8 \end{bmatrix}\Rightarrow ax=b \end{equation}$
方程法
我们知道向量b不在向量a的列空间中，直接求解无法计算出来，所以需要将向量b投影到向量a所在的直线上。故两边同时乘以 $a^T$
$\begin{equation} a^Ta\hat{x}=a^Tb\Rightarrow \hat{x}=\frac{a^Tb}{a^Ta}=\frac{19}{7} \end{equation}$

5. Gram-Schmidt正交化

假设我们有两个向量 $a_1,a_2$ 表示如下,通过这两个向量，用Gram-Schmidt找到一组正交标准基。
$\begin{equation} a_1=\begin{bmatrix}1\\\\2\\\\3\end{bmatrix};a_2=\begin{bmatrix}1\\\\1\\\\1\end{bmatrix} \end{equation}$

第一个向量 $b_1=a_1$
$\begin{equation} b_1=a_1;b_2=a_2-\frac{a_2^Tb_1}{b_1^Tb_1}b_1=\begin{bmatrix}\frac{4}{7}\\\\\frac{1}{7}\\\\-\frac{2}{7}\end{bmatrix} \end{equation}$
那么就得到一组标准正交基如下：
$\begin{equation} b_1=\frac{1}{\sqrt{14}}\begin{bmatrix}1\\\\2\\\\3\end{bmatrix}；b_2=\frac{\sqrt{21}}{7}\begin{bmatrix}\frac{4}{7}\\\\\frac{1}{7}\\\\-\frac{2}{7}\end{bmatrix} \end{equation}$

6. 矩阵A的行列式

矩阵A为4行4列，其特征值满足什么条件下，矩阵可逆？
$\begin{equation} det(A)=|A|=\lambda_1\lambda_2\lambda_3\lambda_4 \end{equation}$
由上公式可得：
$\begin{equation} \lambda_1\lambda_2\lambda_3\lambda_4\neq0 \Rightarrow |A|\neq0\Rightarrow A可逆 \end{equation}$

求 $det(A^{-1})$
$\begin{equation} Ax=\lambda x\Rightarrow A^{-1}Ax=\lambda A^{-1}x \Rightarrow \frac{1}{\lambda}x=A^{-1}x \end{equation}$
所以可得：
$\begin{equation} A^{-1}x=\frac{1}{\lambda}x \end{equation}$
可以得出：
$\begin{equation} det(A^{-1})=|A^{-1}|=\frac{1}{\lambda_1}\frac{1}{\lambda_2}\frac{1}{\lambda_3}\frac{1}{\lambda_4} \end{equation}$
求 $d e t (A + I)$
$\begin{equation} B=A+I;Bx=Ax+x=(\lambda +1)x \end{equation}$
$\begin{equation} det(B)=(\lambda_1+1)(\lambda_2+1)(\lambda_3+1)(\lambda_4+1) \end{equation}$

7. 代数余子式

假设我们由一个矩阵A 表示如下：
$\begin{equation} A=\begin{bmatrix} 1&1&0&0\\\\ 1&1&1&0\\\\ 0&1&1&1\\\\ 0&0&1&1 \end{bmatrix}；D_n=det(A_n) \end{equation}$

对矩阵进行代数余子式的按第一行分解
$\begin{equation} D_n=1*(-1)^{1+1}D_{n-1}+1*(-1)^{1+2}D_{n-2} \end{equation}$
$\begin{equation} D_n=D_{n-1}-D_{n-2} \end{equation}$
矩阵形式：
$\begin{equation} \begin{bmatrix} D_{n}\\\\ D_{n-1} \end{bmatrix}= \begin{bmatrix} 1&-1\\\\ 1&0 \end{bmatrix} \begin{bmatrix} D_{n-1}\\\\ D_{n-2} \end{bmatrix};u_n=\begin{bmatrix} D_{n}\\\\ D_{n-1} \end{bmatrix}\Rightarrow u_n=Au_{n-1} \end{equation}$
将矩阵A进行分解：
$\begin{equation} \lambda_1=\frac{1+\sqrt{3}i} {2};v_1=\begin{bmatrix}\lambda_1\\\\1\end{bmatrix}\lambda_2=\frac{1-\sqrt{3}i}{2};v_2=\begin{bmatrix}\lambda_2\\\\1\end{bmatrix} \end{equation}$
根据欧拉公式： $e^{\theta i}=\cos(\theta)+i\sin(\theta)$ 化简特征值：
$\begin{equation} \lambda_1=e^{\frac{\pi}{3}i};\lambda_2=e^{-\frac{\pi}{3}i}; \end{equation}$
可以看出， $\lambda^6=1$ ,也就是说
$\begin{equation} \lambda^{k+6}=\lambda^{k}\cdot\lambda^6=\lambda^k；\Lambda^{k+6}=\Lambda^{k} \end{equation}$
换到矩阵中可得：
$\begin{equation} A^{k+6}=S\Lambda^{k+6}S^{-1}=S\Lambda^{k}S^{-1}=A^{k}; \end{equation}$
也就是说矩阵 $u_k$ 每6次相乘后的结果跟原来一样。
$\begin{equation} A\begin{bmatrix}\lambda_1&\lambda_2\\\\1&1\end{bmatrix}=\begin{bmatrix}\lambda_1&\lambda_2\\\\1&1\end{bmatrix}\begin{bmatrix}\lambda_1&0\\\\0&\lambda_2\end{bmatrix}\Rightarrow AS=S\Lambda \end{equation}$
$u_k$ 通解：
$\begin{equation} u_k=A^ku_0;A=S\Lambda S^{-1};A^k=S\Lambda^kS^{-1};u_0=SC_0 \end{equation}$
$\begin{equation} u_k=S\Lambda^kS^{-1}SC_0=S\Lambda^kC_0；u_{k+6}=u_k \end{equation}$
小结：
矩阵 $u_k$ 既不收敛，又不发散，会沿着周期为6的乘积结果不停转动。

8. 特殊矩阵

8.1 求投影到 $A_3$ 列空间的投影矩阵P

假设有如下矩阵 $A_4$ ,求投影到 $A_3$ 列空间的投影矩阵P
$\begin{equation} A_4=\begin{bmatrix} 0&1&0&0\\\\ 1&0&2&0\\\\ 0&2&0&3\\\\ 0&0&3&0 \end{bmatrix}=A^T_4; A_3=\begin{bmatrix} 0&1&0\\\\ 1&0&2\\\\ 0&2&0 \end{bmatrix}=A^T_3; \end{equation}$

$A_3$ 的列空间中可以看出第1和第2列是不相关的。故可得
$\begin{equation} A^{'}_3=\begin{bmatrix} 0&1\\\\ 1&0\\\\ 0&2 \end{bmatrix}; A^{'T}_3=\begin{bmatrix} 0&1&0\\\\ 1&0&2 \end{bmatrix}; \end{equation}$
投影矩阵P可得如下：
$\begin{equation} P=A^{'}_3(A^{'T}_3A^{'}_3)^{-1} A^{'T}_3= \begin{bmatrix} 0.2&0&0.4\\\\ 0&1&0\\\\ 0.4&0&0.8 \end{bmatrix} \end{equation}$

8.2 求投影到 $A_4$ 列空间的投影矩阵P

因为 $A_4$ 的行列式为9，所以 $A_4$ 的可逆， $A^T_4A_4$ 可逆，投影公式P 如下：
$\begin{equation} P=A_4(A_4^TA_4)^{-1}A_4^T=A_4(A_4)^{-1}(A_4^T)^{-1}A_4^T=I \end{equation}$
所以投影矩阵P为单位矩阵 $I$ ！！！！