最小二乘（Least Squares）

最新推荐文章于 2024-06-25 01:10:41 发布

LXYTSOS

最新推荐文章于 2024-06-25 01:10:41 发布

阅读量6.1k

点赞数 2

分类专栏：机器学习回归统计学习神经网络与机器学习笔记文章标签：机器学习最小二乘回归

本文链接：https://blog.csdn.net/lxytsos/article/details/50989272

版权

神经网络与机器学习笔记同时被 3 个专栏收录

47 篇文章 61 订阅

订阅专栏

机器学习

25 篇文章 0 订阅

订阅专栏

统计学习

4 篇文章 0 订阅

订阅专栏

已经很久没有写博客了，今天决定写一篇关于最小二乘的博客，发表下自己的理解，有不足或错误之处，欢迎大家指正。

最小二乘，又被叫做最小乘方or最小平方，它是一种优化技术。当给你一堆数据点，你可以想象成初中数学课堂上学习解析几何的时候，在坐标轴上给出一些点（通常这些点连起来是一条直线），然后要求算出这条直线的解析式（也就是拟合这些数据点），或计算斜率（可以理解成回归系数），然后要你算出当x等于多少时y的值之类的。我们在利用坐标轴上的点进行计算解析式的时候，其实就是找到最佳斜率（回归系数）来对这些数据点进行拟合了。

现在回到最小二乘上来，最小二乘，就是用来找到最佳的回归系数的方法。在过去的30年中，线性模型一直是统计学的主要支柱，并且现在仍然是最重要的工具之一。给定一个输入向量 $X=(X_1, X_2,\cdots,X_p)$ ，可以通过下面的模型来预测输出 $Y$ :

Y^= β^0 + \sum j = 1 p X j β^j

$\hat Y = \hat \beta_0 + \sum_{j = 1}^p X_j\hat \beta_j$ 项

β ^ 0 $\hat \beta_0$ 是截距，在机器学习中也称偏置（bias）。通常我们将

X 0 $X_0$ 设为 1，与偏置相乘，这样，上面向量形式的线性模型可以写成内积的形式：

Y^= X T β^

$\hat Y = X^T\hat \beta$ 可以发现，上面的公式中

Y $Y$ 和

β $\beta$ 上面有个尖尖的帽子样的符号，这表示一个最佳估计，与真实的

Y $Y$ 和

β $\beta$ 区分开。

现在我们需要找到这样的最佳 $\beta$ 来对 $Y$ 进行预测，我们要找到使误差和，也就是 $\sum_{i = 1}^N(y_i - x_i^T\beta)$ 最小的 $\beta$ ,如果将各个误差累加的话，正负误差会抵消，那就起不到效果，找不到最佳回归系数，所以将每个误差值先平方，再求和，这样就不存在误差抵消的情况，这就叫做最小二乘：