线性回归模型

在这个线性回归算法中,你将了解到整个监督学习的过程,过程是什么模样。

让我们看一个预测房价价格的例子。我们将使用一组俄勒冈州波特兰市的城市住房价格的数据,我将根据不同尺寸的房子对应不同的售价组成的数据集来画图。

比如根据这组数据,你有一个朋友想卖房子,假设房子的大小1250平方英尺,你想告诉他们,这个房子能卖多少钱。你可以进行模型拟合,这组数据似乎更加适合直线,根据这个模型,你可以告诉你朋友房子能卖多少钱。这是一个监督学习的例子,它之所以能够进行监督学习,是因为每个样本都有一个“正确的答案”,也就是说,我们知道了数据集中卖出的房子的实际大小和价格。而且这还是一个回归的例子。回归指的是我们预测一个具体的数值,这里指的是价格。当然监督学习,还有另外一种算法叫分类问题,我们用他来预测离散值的输出,比如观察肿瘤是良性还是恶性的。

如果正式一点的讲,在监督学习中,我们有一个数据集,它被称为一个训练集,以住房价格为例,我们有一个房价的训练集,我们的工作是从这个训练集中找出如何预测房价。让我们定义一些课程中用到的符号,具体如下:

       (1)小写字母m,表示训练集中的数量,例如下面的表格,如果有47个样本,那么m的值是47。

       (2)小写字母x,表示输入的特征。

       (3)小写字母y,表示输出变量,也就是我们要预测的目标变量。

       关于符号,我要使用(x,y)表示训练样本,表格中每一行都是一个训练样本。要表示特定训练样本时,我将使用(x (i),y (i))来表示第i个训练样本。这里的i指的是表中的第i行,不是幂指数。

 例如:x(1)=2104,y(1)=460

       如何给训练集下定义?先来看看监督学习算法是如何工作的?

我们向学习算法提供训练集,比如说我们房价的训练集,学习算法的任务是输出一个函数,通常用h表示,h代表假设函数,假设函数的作用是把房子的大小作为输入变量,比如你朋友圈想出售的新房子的大小,把它作为x的值,而他会输出相应房子的预测y值,所以h是一个引导从x到y的函数。这个假设函数是机器学习中的专业用语,不要纠结为什么这么称呼。

       当我们设计一个学习算法时,下一个需要做的事就是决定怎么表示这个假设函数h,我们接下来的函数,将使用如下方式表示:

hθ(x)=θ0 +θ1x

       在图中画出所有这些意味着我们要来预测y是一个关于x的线性函数,这就是数据集。函数的作用是预测y是关于x的线性函数。

       为什么是一个线性函数呢?有时候我们想模拟一个更复杂的,比如非线性的函数,但是由于这种线性的函数是学习的基础,我们将在这个例子的基础上,将先拟合线性函数,后面在这个基础上,最终处理更加复杂的模型以及学习更复杂的算法,如果给上述模型起个名字,这种模型叫做线性回归,上面的例子是一个一元线性回归。由于上述假设函数中的x称为单变量(仅仅是单一变量的高大上的称呼),所以这个模型也可以称为单变量线性回归。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值