最小二乘法的原理及实现

最新推荐文章于 2024-06-11 20:53:31 发布

MAUM

最新推荐文章于 2024-06-11 20:53:31 发布

阅读量9.8k

点赞数 2

分类专栏：压缩感知文章标签：最小二乘法 OLS OMP

本文链接：https://blog.csdn.net/maum61/article/details/84021914

版权

压缩感知专栏收录该内容

3 篇文章 2 订阅

订阅专栏

两个版本理解最小二乘

1 从纸面上粗浅理解

2 从几何意义上深入理解

1 从纸面上粗浅理解

最近需要用到最小二乘法，尽管一直知道通过matlab直接就能实现，但是具体做法以及推导过程不清楚，心虚，以此博文记录一下。

回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量，且因变量和自变量之间是线性关系，则称为多元线性回归分析。对于二维空间线性是一条直线；对于三维空间线性是一个平面，对于多维空间线性是一个超平面。 [4]

最常用的是普通最小二乘法（ Ordinary Least Square，OLS）：所选择的回归模型应该使所有观察值的残差平方和达到最小。（Q为残差平方和）- 即采用平方损失函数。

步骤：

1、样本回归模型：

2、平方损失函数

3、 Q对两个待估参数的偏导数

4、解方程

求得使平方损失函数取得极值点的那两个系数。这是一次线性回归问题。

使用向量表示OLS（Ordinary Least Square, 普通最小二乘法），则有：

XTXβ=XTy

也即：
β=(XTX)-1XTy

其中是最小二乘估计的线性回归系数。

也就是说，通过原始的散点（Xi,Yi），计算得到的是系数向量，再进行计算时，使用向量与X相乘，即可得到Y。

最小二乘法在OMP稀疏恢复算法中有用到。

2 从几何意义上深入理解

很多拟合问题最终都可以归结为Ax=b的形式，比如，我们用传感器得到一组数据，例如，时刻t1=1，温度f是5，时刻t2=2，温度是8，时刻t3=3,温度是15，时刻t4=4,温度是16，那么(t,f)可以总结为(1,5),(2,8),(3,15),(4,16)。假如我们经验认为，温度和时刻是一次函数，也就是:

f=x1+x2*t

代入数据后，写成Ax=b的形式：

$\begin{bmatrix} 1 & 1\\ 1&2 \\ 1 &3 \\ 1 & 4 \end{bmatrix}\begin{bmatrix} x1\\ x2 \end{bmatrix}=\begin{bmatrix} 5\\ 8\\ 15\\ 16 \end{bmatrix}\Rightarrow \begin{bmatrix} \mathbf{v1} & \mathbf{v2} \end{bmatrix}\begin{bmatrix} x1\\ x2 \end{bmatrix}=\mathbf{b}$ (1)

这里v1 v2 b是列向量，x1,x2是标量，就是一个实数。

这里的限制方程有4个，自变量只有两个，如果任意两个等式之间不存在倍数关系，或者不是线性关系，那么这个方程的解析解是不存在的，也就是精确的解是没有的，因为是超定方程。或者这样理解，把A看做是基向量，b是通过v1=[1 1 1 1]T和v2=[1 2 3 4]T这两个列向量线性叠加而来，系数分别是x1 x2。可以想象，由这两个列向量的任意组合的集合，将会张成一个类似于平面的超平面S。

当然，如果这两个列向量是[1 0]T和[0 1]T的话，那么他们的任意组合就是我们平常可以看到的二维平面。维度变为4时，想象不出来其样貌，但是依然遵守基本的性质，比如垂直的向量，他们的点积是0，也就是对应元素相乘的和是0。

假如无论x1 x2怎么组合，都无法用v1和v2表示，那就证明向量b不在v1 v2张成的空间中，这时候我们想到什么办法呢？退而求其次，我们找到b在S上的投影 $\tilde{b}$ ，用它来近似b，这不就是最妥协的办法了吗？

这样，根据向量的减法， $b-\tilde{b}$ 就是与 $\tilde{b}$ 垂直的法线了。法线是和平面S处处垂直的，也就是和任意向量Ax的内积都是0，那根据垂直的性质：

$(\mathbf{b}-\tilde{\mathbf{\mathbf{b}}},\mathbf{A}\mathbf{x}) =0 \Rightarrow ({\mathbf{A}\mathbf{x}})^{T}(\mathbf{b}-\tilde{\mathbf{b}})=0$ (2)

( , )表示内积，点积，用正常的按对应元素乘后相加就表示为右侧的形式。

$({\mathbf{A}\mathbf{x}})^{T}(\mathbf{b}-\tilde{\mathbf{b}})=0\Rightarrow \mathbf{x}^{T}\mathbf{A}^{T}(\mathbf{b}-\tilde{\mathbf{b}})=0$ （3）

将 ${\mathbf{A}}^{T}(\mathbf{b}-\tilde{\mathbf{b}})$ 看做是列向量，与x同型。一个向量和同型的任意向量x的内积都是0，那么只能说明，这个向量是0。

$\mathbf{x}^{T}\mathbf{A}^{T}(\mathbf{b}-\tilde{\mathbf{b}})=0\Rightarrow \mathbf{A}^{T}(\mathbf{b}-\tilde{\mathbf{b}})=0$ (4)

那 $\tilde{b}$ 怎么表示？应该牢记， $\tilde{b}$ 是b在平面S上的投影，自然只能用v1 v2来表示：

$\begin{bmatrix} \textbf{v1} & \textbf{v2} \end{bmatrix}\begin{bmatrix} \tilde{x1}\\ \tilde{x2} \end{bmatrix}=\textbf{A}\tilde{\textbf{x}}=\mathbf{\tilde{b}}$ (5)

（5）代入(4)，就变成了

$\mathbf{A}^{T}(\mathbf{b}-\tilde{\mathbf{b}})=0\Rightarrow \mathbf{A}^{T}(\mathbf{b}-\mathbf{A}\tilde{\mathbf{x}})=0$ (6)

整理后解可以得到最小二乘解:

$\mathbf{A}^{T}(\mathbf{b}-\mathbf{A}\tilde{\mathbf{x}})=0\Rightarrow \mathbf{A}^{T}\mathbf{b}=\mathbf{A}^{T}\mathbf{A}\tilde{\mathbf{x}}\Rightarrow \tilde{\mathbf{x}}=(\mathbf{A}^{T}\mathbf{A})^{+}\mathbf{A}^{T}\mathbf{b}$

这里的 $(\mathbf{A}^{T}\mathbf{A})^{+}$ 是伪逆，可以简单理解为是ATb除以（ATA）。

这样，就得到了最小二乘拟合的系数。

MAUM

关注

2
点赞
踩
21

收藏

觉得还不错? 一键收藏
0
评论
最小二乘法的原理及实现

最近需要用到最小二乘法，尽管一直知道通过matlab直接就能实现，但是具体做法以及推导过程不清楚，心虚，以此博文记录一下。回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量，且因变量和自变量之间是线性关系，则称为多元线性回归分析。对于二维空间线性是一条直线；对于三维空间线性是一个平面，对于多维空间线性是一个超平面。[4]最常用的是普通最小二乘法（ Ordinary ...
复制链接

扫一扫

专栏目录