监督学习，无监督学习和半监督学习

最新推荐文章于 2023-11-11 16:25:16 发布

〆bird in the pool✘✘

最新推荐文章于 2023-11-11 16:25:16 发布

阅读量451

点赞数 1

分类专栏： AI的路上 AI—learning

本文链接：https://blog.csdn.net/qq_42057046/article/details/96860432

版权

AI的路上同时被 2 个专栏收录

17 篇文章 2 订阅

订阅专栏

AI—learning

12 篇文章 0 订阅

订阅专栏

最近在学习的过程中，我常常会遇到监督学习和非监督学习，因此对这两个概念进行了一下总结，另外又补充了一下半监督学习的概念

机器学习的常用方法，主要分为有监督学习(supervised learning)和无监督学习(unsupervised learning)。监督学习，就是我们常说的分类，通过已有的训练样本（即已知数据以及其对应的输出）去训练得到一个最优模型，再利用这个最优模型将所有的输入映射为相应的输出，对输出进行简单的判断从而实现分类的目的，也就具有了对未知数据进行分类的能力。无监督学习（也有人叫非监督学习）则是另一种研究的比较多的学习方法，它与监督学习的不同之处，在于我们事先没有任何训练样本，而需要直接对数据进行建模。无监督学习里典型的例子就是聚类了。聚类的目的在于把相似的东西聚在一起，而我们并不关心这一类是什么。因此，一个聚类算法通常只需要知道如何计算相似度就可以开始工作了。

监督学习

监督学习(supervised learning)是指用已经标记好的数据(labelled data)，做训练来预测新数据的类型(class)，或者是值。预测已有类型叫做分类(classification)，预测一个值叫做回归(regression)。

我们出生时，懵懵懂懂，可以说什么也不知道，从孩子时开始我们就被大人们教授这是鸟啊、那是狗啊、那是房子啊，等等。我们所见到的景物就是输入数据，而大人们对这些景物的判断结果（是房子还是鸟啊）就是相应的输出。当我们见识多了以后，脑子里就慢慢地得到了一些泛化的模型，这就是训练得到的那个（或者那些）函数，从而不需要大人在旁边指点的时候，我们也能分辨的出来哪些是房子，哪些是鸟。

监督学习里典型的例子就是KNN、SVM，BP神经网络

我们什么时候会用到监督学习呢？

如果我们在分类的过程中有训练样本(training data)，则可以考虑用监督学习的方法；如果没有训练样本，则不可能用监督学习的方法。

无监督学习

无监督学习(unsupervised learning)是指不需要提前对数据做标记，直接对它们做聚类(clustering)。

但是在我们自身认识世界的过程中很多处都用到了无监督学习。比如我们去参观一个画展，我们完全对艺术一无所知，但是欣赏完多幅作品之后，我们也能把它们分成不同的派别（比如哪些更朦胧一点，哪些更写实一些，即使我们不知道什么叫做朦胧派，什么叫做写实派，但是至少我们能把他们分为两个类）。

半监督学习

半监督学习(semi-supervised learning)其实就和它的名字一样，同时用了有监督学习的方法和无监督的方法，更准确的说是同时用了标记好的数据(labelled data)和未标记的数据(unlabelled data) 。

总结上面所说的监督学习用于分类和回归，无监督学习用于聚类，那么半监督学习的目的是什么呢？目的是用现有的数据训练出更好的数据模型。要知道，现在占主导地位的还是有监督学习，如何更好的利用无监督学习还是一个正在研究的话题，之所以需要开发他的原因是我们不需要人工的给数据打标签，这样会非常省事。从这里可以得知，虽然我们现在可以有海量的数据，但是其中只有很少一部分是有标签的。所以半监督学习就是要同时利用有标记的数据和没标记的数据。举个例子：

假设上图中红点和蓝点表示两类数据class1,class2。绿点表示没有被标记的数据。如果现在我们用支持向量机(SVM)，仅对有标记的数据分类，那么分割线如左图所示。但是其实真是情况是，如果我们不忽略为做标记的数据，数据的分布其实是如右图所示的。那么一个更好的划分线也应该是如右图所示的垂直线。这就是半监督学习的基本原理。

参考链接：https://blog.csdn.net/jwh_bupt/article/details/7654120

https://blog.csdn.net/dugudaibo/article/details/79061673

https://www.zhihu.com/question/27138263/answer/230490634