监督学习和非监督学习的区别

    如果我们想要预测的是离散值,例如“好瓜”“坏瓜”,此类学习任务称为“分类”;如果想要预测的是连续值,例如西瓜成熟度0.95、0.37,此类学习任务称为“回归”。

    学得模型后,使用其进行预测的过程称为“测试”,被预测的样本成为“测试样本”。例如在学得f后,对测试例x,可得到其预测标记y=f(x)。

    我们还可以对西瓜做“聚类”,即将训练集中的西瓜分为若干组,每组称为一个“”;这些自动形成的簇可能对应一些潜在的概念划分,例如“浅色瓜”“深色瓜”,甚至“本地瓜”“外地瓜”。这样的学习过程有助于我们了解数据内在的规律,能为更深入地分析数据简历基础。需说明的是,在聚类学习中,“浅色瓜”“本地瓜”这样的概念我们事先是不知道的,而且学习过程中使用的训练样本通常不拥有标记信息。

    根据训练数据是否拥有标记信息,学习任务可大致分为两大类:“监督学习”和“非监督学习”,分类和回归是前者的代表,而聚类是后者的代表。再解释一下,监督学习其实就是我们对输入样本经过模型训练后有明确的预期输出,非监督学习就是我们对输入样本经过模型训练后得到什么输出完全没有预期。结合西瓜的例子,监督学习就是我们知道经过模型训练后会分为好瓜或者坏瓜,而非监督学习则会将西瓜聚类为几种我们之前没有明确定义的瓜,如“浅色瓜”“外地瓜”。

    这样结合西瓜的例子解释后,相信你能对经常听到的监督学习和非监督学习两个概念有了比较清晰的了解。


评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值