机器学习——简单线性回归算法（Linear Regression）

最新推荐文章于 2024-03-01 16:42:40 发布

Liuyt_61

最新推荐文章于 2024-03-01 16:42:40 发布

阅读量797

点赞数 1

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/weixin_37580591/article/details/102881795

版权

线性回归

解决回归问题
思想简单
许多强大的非线性模型的基础
结果具有很好的可解释性
蕴含机器学习中的很多重要思想

在上图坐标上，每一个点都表示一个数据，假设是房产价格的数据。线性回归算法说我们认为房屋的面积和价格成一定的线性关系，也就是说随着房屋面积的增大，价格也会增大，并且增大是线性的。

那么在这种假设下，找到一条直线，希望最大程度的“拟合”样本特征和样本输出标记之间的关系。对于上图来说，样本特征是房屋面积，房屋价格为输出标记。
区别于分类问题，分类问题坐标轴横纵轴是两个样本特征，而输出标记是用标记点的颜色进行表示的，而回归问题只有横轴表示一个样本特征，纵轴房屋价格就是输出标记。分类问题需要预测是一个具体的数值，这具体数值是在一个连续的空间里的，而不是简单的用不同的颜色代表不同的类别。

如果需要看有两个样本特征的回归问题，那么就需要在三维空间进行观察。样本特征只有一个，称为简单线性回归；样本特征有多个成为多元线性回归。

假设我们找到最佳拟合的直线方程：y=ax+b

则对于每一个样本点 $x i$

根据我们的直线方程，预测值为:

$\hat{y}~i = ax~i+ b$

真值为：$ y~i$

我们希望 $\hat y~i$ 和 $y i$ 的差距尽量小，也就是 $\hat{y}~i$ ，但是可能存在差值为正为负的情况，无法直接使用减法。 $\hat{y}~i|$ 使用绝对值的形式虽然可以求得预测值与真值的差距，但是 $y = a ∣ x ∣ + b$ 并非处处可导，对于后续求取参数a、b的值时不方便。

采用 $\hat{y}~i)^2$ 的形式来衡量预测值与真值之间的差距，
所以我们考虑所有的样本： $\displaystyle \sum^{m}_{i=1}(y~i - \hat{y}~i)^2$

所以我们的目标是使 $\displaystyle \sum^{m}_{i=1}(y~i - \hat{y}~i)^2$

最低0.47元/天解锁文章

Liuyt_61

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
机器学习——简单线性回归算法（Linear Regression）

线性回归解决回归问题思想简单许多强大的非线性模型的基础结果具有很好的可解释性蕴含机器学习中的很多重要思想在上图坐标上，每一个点都表示一个数据，假设是房产价格的数据。线性回归算法说我们认为房屋的面积和价格成一定的线性关系，也就是说随着房屋面积的增大，价格也会增大，并且增大是线性的。那么在这种假设下，找到一条直线，希望最大程度的“拟合”样本特征和样本输出标记之间的关系。对于上图来...
复制链接

扫一扫