本文重点:
我们前面的课程已经知道了什么是监督学习和非监督学习,监督学习分为回归和分类,本节课我们就将讲解监督学习中最基本的回归算法-----线性回归算法。
注意:由于这是本专栏中的第一个算法模型,我们从易到难,我们使用的数据集非常简单,只有一个样本特征(尺寸),所以我们这里介绍的线性回归模型可以称为单变量的线性回归模型。
房价预测问题
房价预测是一个经典的机器学习问题,它通常用来预测一个房子的价格。现在有一个房价数据集,如上所示,不同的尺度对应不同的价格。
比如当房子尺寸是852时,房子的价格是178,当房子的尺寸是1534时,房子的价格是315,那么现在假设我们手里有一个房子的尺寸是1000平方尺大小,那么我们能通过以上数据集评估出来房子价格吗?
这个问题是不是很熟悉,就是初中学习的y=kx+b的问题,x就是尺寸,y就是价格,基于上述数据计算出来k和b,然后就可以代入x=1000了,求出y了。
没错很简单,这就是线性回归模型。
线性回归模型的表示
y=kx+b就是线性回归模型