监督式学习(Supervised learning)

最新推荐文章于 2023-07-27 08:30:00 发布

y小川

最新推荐文章于 2023-07-27 08:30:00 发布

阅读量9.3k

点赞数 3

分类专栏： machine-learning 文章标签：监督式学习回归问题分类问题目标变量

machine-learning 专栏收录该内容

34 篇文章 6 订阅

订阅专栏

监督式学习是由一组人工标记的数据推测出假设函数的学习方法。大量训练样本构成样本集。每个训练样本包含输入值和期望输出值。下面我们看一个例子。

我们有美国波特兰地区47套房屋的居住面积及其价格的数据集。

居住面积( $\mathrm{feet}^2$ )	价格(1000$s)
2104	400
1600	330
2400	540
1416	232
3000	540
…	…

数据绘制在二维图上：
house data

根据这些数据我们可以找到预测波特兰房屋价格的方法（一个关于房屋面积的函数）吗？

我们先申明一些标记符， $x^{(i)}$ 表示输入变量（例子中的房屋面积），也称为输入特征。 $y^{(i)}$ 表示我们要去预测的目标变量。一对 $(x^{(i)},y^{(i)})$ 称为训练样本，而数据集就是 $m$ 个我们用来学习的训练样本的集合 $\{ (x^{(i)},y^{(i)});i=1,\ldots,m \}$ ，上标 $(i)$ 表示第 $i$ 个样本。 $\mathcal{X}$ 表示输入空间， $\mathcal{Y}$ 表示输出空间，在此次例子中 $\mathcal{X} = \mathcal{Y} = \Bbb{R}$ 。