16.投影矩阵，最小二乘

取个名字真难呐

已于 2024-05-16 21:00:56 修改

阅读量554

点赞数 8

文章标签：矩阵线性代数

于 2024-05-16 05:57:45 首次发布

本文链接：https://blog.csdn.net/scar2016/article/details/138937621

版权

文章目录

1. 投影矩阵
- 1.1 投影矩阵P
- 1.2 投影向量
2. 线性回归
3. 直线拟合
4. A^TAX=0

1. 投影矩阵

1.1 投影矩阵P

根据上节知识，我们知道当我们在解 $A X = b$ 的时候，发现当向量b不在矩阵A的列空间的时候，我们希望的是通过投影，将向量b投影到矩阵A的列空间中，这样，我们可以求得一个近似的解，得到如下公式
$A^TA\hat{X} = A^Tb\tag{1}$

我们假设 $A^TA可逆，$ 可得到解为：
$\hat{X}=(A^TA)^{-1}A^Tb\tag{2}$
那么可以得到向量b在矩阵A的列空间向量p表示如下：
$p=A(A^TA)^{-1}A^Tb\tag{3}$
由上可以看出，我们将矩阵 $P=A(A^TA)^{-1}A^T$ 代入可得：
$p=Pb\tag{4}$
我们发现，向量b为不在矩阵A的列空间中的向量,p为向量b通过投影矩阵P转换后的向量。并且向量p是在矩阵A的列空间中。

1.2 投影向量

对于任意向量b来说，我们可以通过正交分解，将向量b分解到两个垂直的向量空间中，我们考虑两个极端的情况下

假设向量b在矩阵A的列空间中，那么向量b通过投影矩阵P的转换，还是得到其本身
$Pb=b\tag{5}$
假设向量b在垂直于矩阵A的列空间中，那么向量b通过投影矩阵P的转换，得到的将是零向量
$Pb=0\tag{6}$
那么我们思考下，什么向量空间是垂直于矩阵A的列空间的呢？我们之前学过矩阵A的四个子空间，分别是

Row(A) —> 矩阵A的行空间；2.Colum(A) —> 矩阵A的列空间
N(A) —> 矩阵A的零解空间；4. $N(A^T)$ —> 矩阵 $A^T$ 的零解空间
我们可以将 $A^T$ 按列向量拆解得到如下
$A^T=\begin{bmatrix}a_1^T\\\\a_2^T\\\\\vdots\\\\a_n^T \end{bmatrix};\begin{bmatrix}a_1^T\\\\a_2^T\\\\\vdots\\\\a_n^T \end{bmatrix}\begin{bmatrix}y_1&y_2&\dots&y_n\end{bmatrix}=0\tag{7}$

由上述可以看出， $A^T$ 的零解空间是垂直于矩阵A的列空间的，所以我们可以将任意向量b 通过正交分解为一部分投影在列空间的向量p，另一部分投影在 $A^T$ 的零解空间中的e

$p=Pb\\\\e=(I-P)b\tag{8}$

2. 线性回归

3. 直线拟合

假设我们有3个点，分别为A(1,1),B(2,2),C(3,2),需要拟合一个直线，如何保证 |AX-b|的值最小？
在这里插入图片描述

由上述两图可以看出，同样一个线性回归问题，左边可以用坐标图表示，右边可以用向量的形式表示，它们是同一问题的不同表现形式。
定义拟合直线为 $Y = C + D X$ ,A,B,C在直线l上的拟合点用p1,p2,p3表示

$C+D=1\\\\C+2D=2\\\\C+3D=2\tag{9}$

矩阵形式如下：
$\begin{bmatrix}1&1\\\\1&2\\\\1&3\end{bmatrix}\begin{bmatrix}C\\\\D\end{bmatrix}=\begin{bmatrix}1\\\\2\\\\2\end{bmatrix}\Rightarrow AX=b\tag{10}$
那么每个点关于拟合点的误差为
$e_1=C+D-1\\\\e_2=C+2D-2\\\\e_3=C+3D-2\tag{11}$
目前我们的目的是找到最优的 $\hat{X}$ :
$\hat{X}=\begin{bmatrix}\hat{C}\\\\\hat{D}\end{bmatrix}$
可得方程组表示如下：
$A^TA\hat{X}=A^Tb;A=\begin{bmatrix}1&1\\\\1&2\\\\1&3\end{bmatrix}\tag{12}$
整理可得如下：
$\begin{bmatrix}3&6\\\\6&14\end{bmatrix}\begin{bmatrix}\hat{C}\\\\\hat{D}\end{bmatrix}=\begin{bmatrix}5\\\\11\end{bmatrix}$
求解的得到 $\hat{C},\hat{D}$ :
$\hat{C}=\frac{2}{3},\hat{D}=\frac{1}{2};\Rightarrow Y=\frac{2}{3}+\frac{1}{2}X\tag{13}$
代入可得 $p_1,p_2,p_3$
$p_1=(1,\frac{7}{6});p_2=(2,\frac{10}{6});p_3=(3,\frac{13}{6});\\\\e_1=\frac{7}{6}-1=\frac{1}{6}\\\\--------\\\\e_2=\frac{10}{6}-2=\frac{-2}{6}\\\\--------\\\\e_3=\frac{13}{6}-2=\frac{1}{6}\tag{14}$
$e=\begin{bmatrix}-\frac{1}{6}\\\\\frac{2}{6}\\\\-\frac{1}{6}\end{bmatrix};b=\begin{bmatrix}1\\\\2\\\\2\end{bmatrix};p=\begin{bmatrix}\frac{7}{6}\\\\\frac{10}{6}\\\\\frac{13}{6}\end{bmatrix}\tag{15}$
我们发现如下数据,线性回归方程的方法和向量结果：
$\begin{bmatrix}1\\\\2\\\\2\end{bmatrix} = \begin{bmatrix}-\frac{1}{6}\\\\\frac{2}{6}\\\\-\frac{1}{6}\end{bmatrix} + \begin{bmatrix}\frac{7}{6}\\\\\frac{10}{6}\\\\\frac{13}{6}\end{bmatrix} \Rightarrow b=e+p\tag{16}$
$：b=e+p\tag{17}$
$\begin{bmatrix}-\frac{1}{6}&\frac{2}{6}&-\frac{1}{6}\end{bmatrix} \begin{bmatrix}\frac{7}{6}\\\\\frac{10}{6}\\\\\frac{13}{6}\end{bmatrix} \Rightarrow e^Tp=0\tag{18}$
$\perp p\tag{19}$
向量e与A的列空间关系
$\begin{bmatrix}1&1\\\\1&2\\\\1&3\end{bmatrix}\begin{bmatrix}-\frac{1}{6}\\\\\frac{2}{6}\\\\-\frac{1}{6}\end{bmatrix} =\begin{bmatrix}0\\\\0\end{bmatrix}\tag{20}$
$\perp 矩阵A的列空间\tag{21}$
真神奇！！！！