监督式学习(Supervised learning)

监督式学习是由一组人工标记的数据推测出假设函数的学习方法。大量训练样本构成样本集。每个训练样本包含输入值和期望输出值。下面我们看一个例子。

我们有美国波特兰地区47套房屋的居住面积及其价格的数据集。

居住面积( feet2 )价格(1000$s)
2104400
1600330
2400540
1416232
3000540

数据绘制在二维图上:
house data

根据这些数据我们可以找到预测波特兰房屋价格的方法(一个关于房屋面积的函数)吗?

我们先申明一些标记符, x(i) 表示输入变量(例子中的房屋面积),也称为输入特征 y(i) 表示我们要去预测的目标变量。一对 (x(i),y(i)) 称为训练样本,而数据集就是 m 个我们用来学习的训练样本的集合{(x(i),y(i));i=1,,m},上标 (i) 表示第 i 个样本。X表示输入空间, Y 表示输出空间,在此次例子中 X=Y=R

监督式学习的过程可表示为下图,训练集通过学习算法训练,求出一个假设(房屋面积对价格的函数)。当我们有新的数据需要预测时,给出房屋面积代入假设模型中,就会给出价格的预测值。
process

如果像这次的例子,目标变量是连续的(认为价格是连续的),学习问题就是回归问题;如果目标变量是离散的,学习问题就称为分类问题

与监督式学习对应的非监督式学习,则是在一群未标记的数据上做数据处理(可以理解为只有 x 值,没有y值)。

  • 3
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值