【线性代数及其应用】05 - 正交性和最小二乘

最新推荐文章于 2023-01-12 22:29:28 发布

Ciaran-byte

最新推荐文章于 2023-01-12 22:29:28 发布

阅读量1.5k

点赞数 1

分类专栏：数学基础文章标签：线性代数

本文链接：https://blog.csdn.net/qq_41741344/article/details/107691259

版权

数学基础专栏收录该内容

46 篇文章 75 订阅

订阅专栏

正交性和最小二乘

文章目录

正交性和最小二乘

1. 正交向量和子空间

1.1 向量正交性的两种证明方法

第一种方法是定义式
$x^T*y=0$
第二种方法是算术方法
$x||^2+||y||^2 = ||x+y||^2$

1.2 子空间的正交性

1.2.1 行空间和零空间

由线性方程组AX=0可知，X是A的零空间，而根据矩阵乘法，前后乘后列为0，矩阵A的行空间与X相乘得0，说明行空间和零空间正交

1.2.2 列空间和左零空间

列空间和左零空间就是A^T的行空间和零空间，因此列空间和左零空间也是正交的

1.3 基的正交性

构成向量空间的基如果不但线性无关，而且互相之间相乘为0，那么这些基就是正交的

2. 投影

2.1 一维空间的投影

2.1.1 投影求解方法

在这里插入图片描述

假设我们要把y投影到x上，y^{^}是投影，我们知道：
$y=\hat{y}+e$

$x^T*e=0$

$\hat{y}=x*a$
可知
$x^T*(y-ax)=0$
即
$\frac{x^T*y}{x^t*x}$
投影为
$\hat{y}=a*x= \frac{x*x^T}{x^t*x}*y=P*y$
P叫做投影矩阵
$\frac{x*x^T}{x^t*x}$
也可以写做
$\hat{y}= a*x=\frac{x^T*y}{x^t*x}*x$

2.1.2 投影矩阵的三大性质

秩为一
P^T=P
P²=P

2.2 n维空间的投影

2.2.1 求解方法

在这里插入图片描述

假设y要投影到n维度空间W中，这里以投影到二维空间为例子进行讲解

法一：理解为向量正交与子空间

我们知道，e是垂直于平面W的，并且投影向量y^{^}是W的基的线性组合，A是W的基向量，所以就有

$A=\begin{matrix}\{a1&a2&a3&a4\}\end{matrix}$

$\hat{y}=A*a$

$\hat{y}$

$A^T*e=0$
可得

$A^T*(y-Aa)=0$

$a=\frac{A^T*y}{A^T*A} \qquad(1)$

$\hat{y}=\frac{A*A^T}{A^T*A}*y \qquad(2)$

$P=\frac{A*A^T}{A^T*A}\qquad(3)$

法二：理解为向量投影到子空间的各个基上

除了从e与W空间正交角度角度考虑外，也可以考虑把y分解到W平面的所有基中，所有基中的分量的叠加，就是y的投影了，投影在基中，就是2.1中的投影到一维空间中，假设W中基向量为a1，a2，a3…

$\hat{y} = \hat{y_1}+\hat{y_2}+...+\hat{y_n}$

$\hat{y} = c_1*a_1+...+c_n*a_n$

$\hat{y} = \frac{a_1^Ty}{a_1^T*a_1}*a_1+...+\frac{a_n^Ty}{a_n^T*a_n}*a_n$

2.3 投影矩阵

2.3.1 投影必须牢记的三个关系式

系数为
$x=(A^T*A)^{-1}*A^T*b$
投影为
$p = Ax=A*(A^T*A)^{-1}*A^T*b$
投影矩阵为
$P =A*(A^T*A)^{-1}*A^T$

2.3.2 A^T*A矩阵的性质

如果A线性无关，A^T*A一定可逆
A^T*A是个对称矩阵
A^T*A是个正定或半正定矩阵，所有特征值大于等于0

可以从其二次型恒不小于0证明
$X^T*(A^T*A)*X=(X*A)^T*(X*A)=||X*A||^2$
如果A各列线性无关，该式子必定大于0，能够证明其是一个正定矩阵。如果A各列线性相关，那么该式子大于等于0，是个半正定矩阵

3.最小二乘

3.1 最小二乘问题的引入–无解方程的近似解

最小二乘问题出现的原因，是为了解决线性方程的过拟合问题。就比如方程数大于变量数的时候，不一定能够得到方程的解，这个时候只能求得一个最接近的解。就比如直线的拟合，假设有很多个坐标点，不一定存在一条过全部坐标点的直线，这个时候只能让各个点到直线的投影距离和最小，也就得到了一个最为接近的解，叫做最小二乘解