监督学习与非监督学习之间的区别
深度学习中会遇到常见的两个问题,一个是分类,一个是回归。
如果我们想要预测的值是一个离散的值,比如说物体识别,识别一个物体是猫还是狗,预测一张图片是美还是丑,还有手写数字辨识,这些都是分类的问题。但是如果我们想要预测的是一个连续的数值,比如说给一张图片进行评分,这就是回归问题。
有的时候我们还会对一些数据做聚类,就是我们可以通过某些聚类算法将某些相同类别的数据聚合在一起,形成一个簇,而这些自动生成的簇可能会存在一些潜在的相同特征,比如说这个簇里面的所有数据都指向 “猫” 的特征,而另一个簇里面的数据都指向 “狗” 的特征等等。但是我们一开始并不知道这些数据指向的是那个类别,也就是说在训练的过程中,这些数据是不具有标记信息的。
根据训练的数据是否具有标记信息,我们可以将学习任务大致分为两类,一类是监督学习,也就是上面提到的分类和回归问题都是监督学习的一中。而另一类是非监督学习,也就是上面提到的聚类。
通过监督学习,我们可以明确预测出某个物体的类别。但是非监督学习的方式只能对数据进行划分,并不能预测出类别,
下面再总结一下
-
监督学习(Supervised learning) :提供带有正确结果的训练集,基于训练集,算法将归纳(generalization)出“如何正确的响应所有可能的输入”,也就是对测试集有一个明确的输出。也称之为”示例学习(learning from examples)”
-
非监督学习(Unsupervised learning): 训练集没有提供正确结果,而是让算法尝试识别不同数据之间的相似性,从而让有共同特征的数据能够被归类在一起。以统计学的方式实现监督学习也称作”密度估计(density estimation)“
常见的监督学习算法: k-近临算法,决策树,朴素贝叶斯等等。
常见的非监督学习算法: k-均值聚类算法,谱聚类算法,EM算法,主成分分析。
对于深度学习来说,深度学习也是一种实现机器学习的技术,也包含了监督学习和非监督学习。常见的卷积神经网络就是一种监督学习方法,在图像分类(如人脸识别)上应用非常广泛。生成对抗网络(GAN)是一种无监督学习方法,经常被用来做图像生成(如深度卷积对抗生成网络(DCGAN)可用于生成卡通图像)。
- 强化学习(Reinforcement learning): 介于监督学习和非监督学习之间。训练中,当算法得出的结果错误时,算法会被告知;但如果算法得出的结果正确,则不会被告知。算法会尝试不同的可能性,直到它学会如何找到正确的结果。监督者会对结果进行打分,却不会给出改进意见,所以强化学习有时也被称为“评价学习(learning with critic)”。