最小二乘法的几种视角

Researcher-Du

已于 2022-11-12 12:12:05 修改

阅读量3.7k

点赞数

分类专栏： Mathematics 文章标签：最小二乘法算法

于 2019-11-27 10:45:47 首次发布

本文链接：https://blog.csdn.net/u011426016/article/details/103265274

版权

Mathematics 专栏收录该内容

9 篇文章 2 订阅

订阅专栏

何为线性回归？就是给定一组散乱数据，要求拟合出一条直线，使得整体误差最小，如下左图所示（下图来源于马同学高等数学博客）。
在这里插入图片描述

已知散点 $x_i,y_i)$ ，现要估计直线方程： $y = k x + b$ .
如果所有点共线，那么有 $y_i = kx_i+b$ 严格成立。如果真是这样还需要拟合吗？抽取两个点立即可以计算一条直线。为了衡量模型的优劣，我们定义一个如下的误差函数，并使得该误差函数最小，就得到了最优的线性回归。上图右侧就标记了： $y_i -( kx_i+b)$ ，即观测数据到模型数据的距离，最小二乘的目的就是要让这个距离的平方之和最小。

$\epsilon = \sum{(y_i -f(x_i))^2} =\sum{(y_i -( kx_i+b))^2} \tag1$

现在要估计直线 $y = k x + b$ ，因此需要求解 $k$ 和 $b$ 的值。有两类方法可以求解这个问题，但其实可以统一起来。

1、通过求导计算

直接对公式(1)求导，可以得到

$\partial \epsilon / \partial k= -2\sum{[y_i-(kx_i+b)]x_i}\tag2$

$\partial \epsilon / \partial b = -2\sum{y_i-(kx_i+b)}\tag3$

令导数为0，联立(2)(3)可以构造关于 $k$ 和 $b$ 的方程组，求解可以得到

$[\sum(x_i-\bar{x})(y_i-\bar{y})] / \sum(x_i-\bar{x})^2\tag4$

$\bar{y} - k\bar{x}\tag5$

其中， $\bar{x} = \sum{x_i} / n， \bar{y} = \sum{y_i} / n$ ，具体推导参见：知乎：线性回归与最小二乘法

2、通过矩阵计算

具体推导如下所示（来源于：线性回归原理及实现（一）：最小二乘法）
在这里插入图片描述

3、线性方程组角度理解

一般来讲，线性方程组 $A x = b$ 按约束条件可以分为三类：
（1）未知数个数小于方程个数，方程超定，无解
（2）未知数个数等于方程个数，方程有唯一解
（3）未知数个数大于方程个数，方程欠定，无解
最小二乘线性回归实际应当属于第一类问题，求解的未知数只有两个，但限定条件很多。
如下如下，如果我们只看没有平方运算的误差项，我们的目标其实是希望用n维空间的 $\vec{X}$ 和 $\vec{1}$ 来线性逼近 $\vec{Y}$ . 很显然如果上述向量都是二维的，那么可以做到完美逼近。

$\sum{y_i - (kx_i + b)} = \begin{bmatrix} y_1\\ y_2\\ \vdots \\ y_n\\ \end{bmatrix} -( k \begin{bmatrix} x_1\\ x_2\\ \vdots \\ x_n\\ \end{bmatrix} + b \begin{bmatrix} 1\\ 1\\ \vdots \\ 1\\ \end{bmatrix} )$

但是，这几个向量都是高维的，这几个向量几乎无法共面，因此根本无法做到。终于要搬出这张图， $y$ 本身不能被 $x$ 和 $1$ 两个向量张成，那只需将 $y$ 投影到 $x$ 和 $1$ 所在的平面，然后这个垂足到 $y$ 的距离即是最小值。
在这里插入图片描述
假设: $A = [a_1,a_2] = [e_1,e_2]$ , 注意这里 $a_1、a_2$ 是列向量

$e_3$ 是 $e_1$ 和 $e_2$ 的线性组合： $\vec{OP} = ka_1+ba_2$ ，设 $X=[k,b]^T$ ，则有

$\vec{OP} = AX$

另外， $y-e_3 = y - AX$ , 当 $O P$ 垂直于 $y P$ 时这个距离最近。

所以有

$a_1^T(y-AX) = 0， a_2^T(y-AX) = 0$

合并起来：

$A^Ty-A^TAX = 0 \to A^TAX = A^Ty$

所以

$X = (A^TA)^{-1}A^Ty$

参考资料：
[1] 线性回归原理及实现（一）：最小二乘法 https://blog.csdn.net/qq_32864683/article/details/80368135
[2] 如何理解最小二乘法？ https://blog.csdn.net/ccnt_2012/article/details/81127117
[3] 最小二乘法理论、推导、算法 https://blog.csdn.net/lql0716/article/details/70165695
[4] 最小二乘解（Least-squares Minimization ） https://blog.csdn.net/kokerf/article/details/72437294
[5] 知乎：线性回归与最小二乘法 https://zhuanlan.zhihu.com/p/36910496
[6] 简书：线性最小二乘和非线性最小二乘：https://www.jianshu.com/p/bf6ec56e26bd

Researcher-Du

关注

0
点赞
踩
12

收藏

觉得还不错? 一键收藏
打赏
1
评论
最小二乘法的几种视角

最小二乘法的几种视角要估计的直线方程可以设为： y=kx+by = kx+by=kx+b, 目前知道一大堆的散点(xi,yi)(x_i,y_i)(xi,yi), 那么，怎么衡量模型的优劣呢？如果所有点共线，那么有 yi=kxi+by_i = kx_i+byi=kxi+b严格成立。如果真是这样还需要拟合吗？抽取两个点立...
复制链接

扫一扫