零基础"机器学习"自学笔记|Note2:单变量线性回归

最新推荐文章于 2024-09-13 16:27:15 发布

木舟笔记

最新推荐文章于 2024-09-13 16:27:15 发布

阅读量87

点赞数

文章标签：算法机器学习人工智能深度学习 python

本文链接：https://blog.csdn.net/weixin_45822007/article/details/114053480

版权

点击蓝字

关注我！

写在前面

这个系列为我在自学【机器学习】时的个人笔记。因为本人为医学相关专业，故学习过程中可能会有较多的纰漏，希望各位读者不吝赐教。本系列以吴恩达老师的【“机器学习”课程】为纲，辅以黄海广老师的【斯坦福大学 2014 机器学习教程个人笔记（V5.51）】，中间会穿插相关数理知识。该系列笔记为实时同步更新，故与本人的学习进度息息相关，希望同在学习相关知识的朋友能多多督促，共同进步。

单变量线性回归

2.1

模型表示(Machine Learning）

例1.

有一个数据集包含俄勒冈州波特兰市的住房价格。根据不同房屋尺寸所售出的价格，画出数据集。如果你朋友的房子是1250平方尺大小，你要告诉他这房子能卖多少钱。那么，你可以做的一件事就是构建一个模型，也许是条直线，从这个数据模型上来看，也许你可以告诉你的朋友，他能以大约220000(美元)左右的价格卖掉这个房子。这就是监督学习算法的一个例子

它被称作监督学习是因为对于每个数据来说，我们给出了“正确的答案”，即告诉我们：根据我们的数据来说，房子实际的价格是多少，而且，更具体来说，这是一个回归问题。回归一词指的是，我们根据之前的数据预测出一个准确的输出值，对于这个例子就是价格，同时，还有另一种最常见的监督学习方式，叫做分类问题，当我们想要预测离散的输出值，例如，我们正在寻找癌症肿瘤，并想要确定肿瘤是良性的还是恶性的，这就是0/1离散输出的问题。更进一步说，在监督学习中我们有一个数据集，这个数据集被称训练集。

以之前的房屋交易问题为例，假使我们回归问题的训练集（Training Set）如表所示.

我们将要用来描述这个回归问题的标记如下:

m 代表训练集中实例的数量

x 代表特征/输入变量

y 代表目标变量/输出变量

(x,y) 代表训练集中的实例

(x^i,y^i) 代表第 i个观察实例

h 代表学习算法的解决方案或函数也称为假设

这就是一个监督学习算法的工作方式,我们可以看到这里有我们的训练集里房屋价格.我们把它喂给我们的学习算法,学习算法的工作了,然后输出一个函数,通常表示为小写 h 表示.h代表hypothesis(假设),h表示一个函数,输入是房屋尺寸大小,就像你朋友想出售的房屋,因此 h 根据输入的 x值来得出 y值,y值对应房子的价格.因此,h是一个从x到y的函数映射.

那么,对于我们的房价预测问题,我们该如何表达h？

一种可能的表达方式为：