Machine Learning 课堂笔记3(线性回归)


我们的第一个学习算法是线性回归算法,在这段视频中你会看到这个算法的概况,更重要的是你将会了解监督学习过程完整的流程,让我们通过一个例子来开始。
这个例子是预测住房价格的,我们要使用一个数据集,数据集包含俄勒冈州波特兰市的住房价格,在这里,我要根据不同房间尺寸所售出的价格,画出我的数据集

比如说,我们来看这个数据集,你有一个朋友正想出售自己的房子
如果你朋友的房子是1250平方尺大小,你要告诉他们这房子能麦多少钱,那么,你可以做的一件事就是构建一个模型,也许是条直线,从这个数据模型上来看,也许你可以告诉你的朋友,他能以大约220000(美元)左右的价格卖掉这个房子,那么这就是监督学习算法的一个例子,它被称作监督学习是因为对于每个数据来说我们给出了“正确的答案”,即告诉我们,根据我们的数据来说,房子实际的价格是多少,而且更具体来说,这是一个回归问题。
回归一词指的是我们根据之前的数据预测出一个准确的输出值。对于这个例子就是价格。

同时,还有另一种最常见的监督学习方式叫做分类问题,当我们想要预测离散的输出值,例如如果我们正在寻找癌症肿瘤并想要确定肿瘤是良性的还是恶性的,这就是0/1离散输出的问题,更进一步的说在监督学习中我们有一个数据集,这个数据集被称训练集,因此对于房价的例子,我们有一个训练集包含不同的房屋价格,我们的任务就是从这个数据中学习预测房屋价格,现在我们给出这门课中经常使用的一些符号定义,我们要定义颇多符号,不过没关系,现在你记不住所有符号也没关系,随着课程的进展你会发现记住这些符号会很有用,我将会在整个课程中用小写的m来表示训练样本的数目,因此在这个数据集中如果表中有47行,那么我们就有47组训练样本,m就等于47,让我们用小写字母x来表示输入变量,往往也被称为特征量,这就是用x表示输入的特征,并且我们将用y来表示输出变量或者目标变量,也就是我的预测结果,那么这就是第二列在这里我要使用(x,y)来表示一个训练样本,所以在这个表格中的单独的一行对应于一个训练样本,为了表示某个训练样本,我将使用上标(i)与y上标(i)来表示,并且用这个表示第i个训练样本,所以这个上标i不是求幂运算,这个(x(i),y(i))括号里的上标i只是一个索引表示我的训练集里的第i行,举个例子,x(1)指的是第一个训练集里的值为2104的输入值,这个就是第一行里的x,x(2)等于1416?这是第二个x,y(1)等于460这是我第一个训练样本的y值。


选择第三个答案
这就是一个监督学习算法的工作方式,我们可以看到这里有我们的训练集里房屋价格,我们把它为给我们的学习算法,这就是学习算法的工作了,然后输出一个函数,按照惯例,通常表示为小写h,h表示hypothesis(假设)h表示一个函数,输入是房屋尺寸大小,就像你的朋友想出售的房屋,因此h根据输入的x值来得出y值,y值对应房子的价格,因此h是一个从x到y的函数映射。

人们经常问我为什么这个函数被称作假设,你们中有些人可能知道hypothesis的意思,从字典或者其他什么方式可以查到,其实在机器学习中这是一个在早期被用于机器学习的名称,它有些绕口,对这类函数来说,这可能不是一个很恰当的名字,对表示从房屋的大小价格到价格的函数映射,我认为这个词“hypothesis”可能不是最好的名称,但是这是人们在机器学习中使用的标准术语,所以不用纠结人们为什么这么叫它,当设计学习算法的时候,我们接下来需要去思考的是怎样得到这个假设的h,对于这一点在接下来视频中我将选择最初的使用规则,h代表hypothesis,我们将会这么写hθ(x)=θ0+θ1*x,为了方便,有时非书面形式也可以这么写hθ(x)就写成h(x)这是缩写方式,但一般来说都会保留这个下标θ。

从这个图片中,所有这一切意味着我们要预测一个关于x的线性函数y对吧,所以这就是数据集和函数的作用用来预测,这里是y关于x的线性函数hθ(x)=θ0+θ1*x,那么为什么是一个线性函数呢?有时候我们会有更复杂的函数,也许是非线性函数,但是由于线性方程是简单的形式,我们将先从线性方程的例子入手,当然,最终我们将会建立更复杂的模型以及更复杂的学习算法,好吧,让我们也给这模型起一个名字,这个模型被称为线性回归(linear regression)模型,另外这实际上是关于单个变量的线性回归,这个变量就是x,根据x来预测所有的价格函数,同时,对于这种模型有另外一个名称称作单变量线性回归,单变量是对一个变量的一种特别的表述方式,总而言之,这就是线性回归。
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值