机器学习之线性回归算法（一）

最新推荐文章于 2024-08-29 20:32:56 发布

置顶

Happy祥子

最新推荐文章于 2024-08-29 20:32:56 发布

阅读量363

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/woaixuexihhh/article/details/84331633

版权

机器学习之线性回归算法(一)

举个例子：

通常将机器学习中有监督分为：回归和分类。回归通过数据预测出一个值，分类是得到一个类别。比如，向银行借钱，回归得到的是，银行借给我多少钱，分类得到的是银行要不要借给我钱。

通俗理解， $x_1$ 、 $x_2$ 就是我们的两个特征，(工资和年龄)， $Y$ 是银行最终会借给我们多少钱，我们所要做的就是找到一条线或者面来拟合我们的数据点。

在这里插入图片描述

$h_{\theta}=\theta_0 +\theta_1x_1+\theta_2x_2$

(其中 $\theta_0$ 是偏置项，与数据无关系)。

对上式子进行整合，化为一般的情况：
$h_\theta=\sum_{i=0}^n\theta_ix_i=\theta^Tx$

真实值与预测值之间肯定是要存在差异的，用 $\varepsilon$ 表示误差。

对于每一个样本：
$y^i = \theta^ix^i+\varepsilon^i$ {（1）}
公式的左侧为真实值，右侧为预测值加上误差
误差（重点）
- 误差 $\varepsilon^i$ 是独立并且具有相同的分布，服从均值为0，方差为 $\theta^2$ 的高斯分布
- 独立：张三和李四一起贷款，他们俩没有关系
- 同分布：他们俩都来我们假定的这家银行，是同一家银行哦
- 高斯分布：银行可能给多，也可能给少，但是绝大多数情况下这个浮动不会太大，极小情况浮动比较大，符合正常情况