2.1单变量线性回归模型表示

首先举一个预测住房价格的例子,其中使用的数据集为某市住房尺寸及对应的价格。如果一间住房面积为1250平方尺,这间住房能卖多少钱?那么,第一件事就是构建一个模型,也许是条直线,从这个数据模型上看,大约能以220000(美元)左右的价格卖掉这间房子。这就是监督学习算法的一个例子。
在这里插入图片描述
它被称作监督学习是因为对于每个数据来说,我们给出了“正确的答案”,即告诉我们:根据我们的数据来说,房子实际的价格是多少,更具体来说,这是一个回归问题。回归一词指的是,我们根据之前的数据预测出一个准确的输出值,对于这个例子就是价格。同时,还有另一种常见的监督学习方式,叫做分类问题,当我们想要预测离散的输出值,例如,我们正在寻找癌症肿瘤,并想要确定肿瘤是良性的还是恶性的,这就是0/1离散输出的问题。更进一步来说,在监督学习中我们有一个数据集,这个数据集被称为训练集。
以之前的房屋交易问题为例,假使我们回归问题的训练集(Training Set)如下表所示:
在这里插入图片描述
将用来描述这个回归问题的标记如下:
m 代表训练集中实例的数量
x 代表特征/输入变量
y 代表目标变量/输出变量
(x,y) 代表训练集中的实例
h 代表学习算法的解决方案或函数也称为假设(hypothesis)
在这里插入图片描述
这就是一个监督学习算法的工作方式,可以看到这里有训练集里的房屋价格,我们把它喂给我们的学习算法,学习算法工作了,然后输出一个函数,通常表示为小写h。h根据输入的x值来得出y值,因此,h是一个从x到y 的函数映射。
那么该如何表达h?一种可能的表达方式为:h(x)=θ₀+θ₁x,因为只含有一个特征/输入变量,因此这样的问题叫做单变量线性回归问题。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值