3 单变量线性回归

    这一节我们将学习第一个线性回归算法,你将学习到算法的流程,更加重要的是你将学习到监督学习过程完整的流程。让我们通过一个例子开始,还是前面介绍的房子价格预测的问题。根据不同房子的大小以及售出的价格我们可以画出下面的数据集表示图。

 

    假设你有一个朋友,正想售出他的房子,房子的大小是1250平方英尺,你要告诉他房子可以卖多少钱。你应该构建一个模型,从这个数据模型上看,可能是一条直线,从图上可以看到,你的朋友的房子大概可以卖22万刀,这是一个监督学习的问题,它被称作监督学习是因为对于每一个给定的数据,我们都知道正确的答案,即告诉我们,根据我们的数据,房子的实际价格是多少,跟进一步的说,这是一个回归问题,回归一词指的是我们根据之前的数据预测出的是一个准确的连续的数值。还有一个常用的监督学习方式,即分类问题,当我们想要预测离散的输出值,例如预测肿瘤是良性还是恶性的例子。

    在监督学习中,我们有一个数据集,这个数据集被称为训练集(training set)。在房子价格预测的例子中,我们有一个训练集,我们的任务是从中学习预测房子的价格。

下面给出常用的一些符号定义:

  1. m: 小写字母m表示训练集的样本的数量;
  2. x: 小写字母x表示输入变量,往往也被称为特征量,表示输入的特征;
  3. y: 小写字母y表示输出变量或者目标变量,也就是我们的预测结果;
  4. (x,y)表示一个训练样本,所以在图中的表格中一行代表一个训练样本;
  5. (x(i),y(i))为了表示每个训练样本,我们使用x商标(i)和y上标(i)来表示,表示第i个训练样本,i只是一个索引,表示训练集里面的第i行, 并不是x和y的i次方。

    监督学习算法的工作方式:

我们可以看到我们的训练集中有房屋的价格,我们将它喂给我们的学习算法,学习输出一个函数(这就是学习算法的工作了),按照惯例,通常小写为h,h代表hypothesis(假设),h是一个函数,输入是房屋的尺寸大小,输出是房屋的价格。输入x,输出y,h是一个从x到y的函数映射。

    当设计学习算法的时候,我们接下来需要去思考的是怎样得到这个假设h。我们使用最初的规则,h代表hypothesis(假设),可以表示为,有时候简写为h(x),但是下标Ɵ通常会被保留,从这个图片中,可以看出,所有的一切就是要预测一个关于x的线性函数y对吧?所以这就是数据集和函数的作用。为什么是线性函数呢?因为线性函数最简单,我们先从线性函数入手。我们也会学习更加复杂的模型和算法。这个模型称作为线性回归模型,实际上这个模型是一个单变量的线性回归模型,只有一个变量x,对于这种模型,有着另外一种名称,称作单变量线性回归,单变量是对一个变量的表述方式,总而言之,这就是线性回归,下面将讨论如何实现这种模型。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值