2.1单变量线性回归模型表示

最新推荐文章于 2022-10-16 21:10:11 发布

迷魅

最新推荐文章于 2022-10-16 21:10:11 发布

阅读量229

点赞数 1

分类专栏：机器学习文章标签：机器学习人工智能

本文链接：https://blog.csdn.net/qq_36422027/article/details/90415209

版权

机器学习专栏收录该内容

11 篇文章 0 订阅

订阅专栏

首先举一个预测住房价格的例子，其中使用的数据集为某市住房尺寸及对应的价格。如果一间住房面积为1250平方尺，这间住房能卖多少钱？那么，第一件事就是构建一个模型，也许是条直线，从这个数据模型上看，大约能以220000（美元）左右的价格卖掉这间房子。这就是监督学习算法的一个例子。
在这里插入图片描述
它被称作监督学习是因为对于每个数据来说，我们给出了“正确的答案”，即告诉我们：根据我们的数据来说，房子实际的价格是多少，更具体来说，这是一个回归问题。回归一词指的是，我们根据之前的数据预测出一个准确的输出值，对于这个例子就是价格。同时，还有另一种常见的监督学习方式，叫做分类问题，当我们想要预测离散的输出值，例如，我们正在寻找癌症肿瘤，并想要确定肿瘤是良性的还是恶性的，这就是0/1离散输出的问题。更进一步来说，在监督学习中我们有一个数据集，这个数据集被称为训练集。
以之前的房屋交易问题为例，假使我们回归问题的训练集（Training Set）如下表所示：
在这里插入图片描述
将用来描述这个回归问题的标记如下：
m 代表训练集中实例的数量
x 代表特征/输入变量
y 代表目标变量/输出变量
(x,y) 代表训练集中的实例
h 代表学习算法的解决方案或函数也称为假设（hypothesis）

这就是一个监督学习算法的工作方式，可以看到这里有训练集里的房屋价格，我们把它喂给我们的学习算法，学习算法工作了，然后输出一个函数，通常表示为小写h。h根据输入的x值来得出y值，因此，h是一个从x到y 的函数映射。
那么该如何表达h？一种可能的表达方式为：h(x)=θ₀+θ₁x，因为只含有一个特征/输入变量，因此这样的问题叫做单变量线性回归问题。