线性回归模型

俺就不告诉你我是谁

于 2018-11-28 11:15:53 发布

阅读量254

点赞数

本文链接：https://blog.csdn.net/q754529322/article/details/84581188

版权

在这个线性回归算法中，你将了解到整个监督学习的过程，过程是什么模样。

让我们看一个预测房价价格的例子。我们将使用一组俄勒冈州波特兰市的城市住房价格的数据，我将根据不同尺寸的房子对应不同的售价组成的数据集来画图。

比如根据这组数据，你有一个朋友想卖房子，假设房子的大小1250平方英尺，你想告诉他们，这个房子能卖多少钱。你可以进行模型拟合，这组数据似乎更加适合直线，根据这个模型，你可以告诉你朋友房子能卖多少钱。这是一个监督学习的例子，它之所以能够进行监督学习，是因为每个样本都有一个“正确的答案”，也就是说，我们知道了数据集中卖出的房子的实际大小和价格。而且这还是一个回归的例子。回归指的是我们预测一个具体的数值，这里指的是价格。当然监督学习，还有另外一种算法叫分类问题，我们用他来预测离散值的输出，比如观察肿瘤是良性还是恶性的。

如果正式一点的讲，在监督学习中，我们有一个数据集，它被称为一个训练集，以住房价格为例，我们有一个房价的训练集，我们的工作是从这个训练集中找出如何预测房价。让我们定义一些课程中用到的符号，具体如下：

（1）小写字母m，表示训练集中的数量，例如下面的表格，如果有47个样本，那么m的值是47。

（2）小写字母x，表示输入的特征。

（3）小写字母y，表示输出变量，也就是我们要预测的目标变量。

关于符号，我要使用（x,y）表示训练样本，表格中每一行都是一个训练样本。要表示特定训练样本时，我将使用（x (i)，y (i)）来表示第i个训练样本。这里的i指的是表中的第i行，不是幂指数。

例如：x(1)=2104，y(1)=460

如何给训练集下定义？先来看看监督学习算法是如何工作的？

我们向学习算法提供训练集，比如说我们房价的训练集，学习算法的任务是输出一个函数，通常用h表示，h代表假设函数，假设函数的作用是把房子的大小作为输入变量，比如你朋友圈想出售的新房子的大小，把它作为x的值，而他会输出相应房子的预测y值，所以h是一个引导从x到y的函数。这个假设函数是机器学习中的专业用语，不要纠结为什么这么称呼。

当我们设计一个学习算法时，下一个需要做的事就是决定怎么表示这个假设函数h，我们接下来的函数，将使用如下方式表示：

hθ（x）=θ0 +θ1x

在图中画出所有这些意味着我们要来预测y是一个关于x的线性函数，这就是数据集。函数的作用是预测y是关于x的线性函数。

为什么是一个线性函数呢？有时候我们想模拟一个更复杂的，比如非线性的函数，但是由于这种线性的函数是学习的基础，我们将在这个例子的基础上，将先拟合线性函数，后面在这个基础上，最终处理更加复杂的模型以及学习更复杂的算法，如果给上述模型起个名字，这种模型叫做线性回归，上面的例子是一个一元线性回归。由于上述假设函数中的x称为单变量（仅仅是单一变量的高大上的称呼），所以这个模型也可以称为单变量线性回归。

俺就不告诉你我是谁

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
线性回归模型

在这个线性回归算法中，你将了解到整个监督学习的过程，过程是什么模样。让我们看一个预测房价价格的例子。我们将使用一组俄勒冈州波特兰市的城市住房价格的数据，我将根据不同尺寸的房子对应不同的售价组成的数据集来画图。比如根据这组数据，你有一个朋友想卖房子，假设房子的大小1250平方英尺，你想告诉他们，这个房子能卖多少钱。你可以进行模型拟合，这组数据似乎更加适合直线，根据这个模型，你可以告诉你朋友房...
复制链接

扫一扫