本篇文章是用来当做笔记的,如有侵权,联系删除。
***********************************************************************************************************分割线*********************************************************************************************
在机器学习过程中,我们经常听到监督学习和无监督学习,想要了解一下这部分内容,于是有了本篇笔记。
我在网上查了部分资料,最通俗的理解如下:
监督 (supervised) = 标签(label),是否有监督,就是输入数据是否有标签,有标签则为有监督学习,否则为无监督学习。至于半监督学习,就是一半有标签(少部分),另外一般没有(很大一部分)
比较官方的定义如下:
监督学习:对于具有概念标记(分类)的训练样本进行学习,以尽可能对训练样本集外的数据进行标记(分类)预测。这里所有的标记(分类)是已知的,因此 训练样本的 歧义性低。监督学习是训练神经网络和决策树的最常见技术。这些技术(神经网络和决策树)高度依赖于事先确定的分类系统给出的信息。
无监督学习:对于没有概念标记(分类)的训练样本进行学习,以发现训练样本集中的结构性知识。这里所有的标记(分类)都是未知的。因此训练样本的歧义性高。常见的无监督学习算法有聚类。
半监督学习:在分类任务的训练集中同时包含有标签数据和无标签数据,通常无标签数据远远多于有标签数据,半监督分类的任务就是训练一个分类器f,这个分类器的表现比只用有标签数据训练得到的分类器好。