有监督的过程为先通过已知的样本来训练得到一个最优的模型,再将这个模型应用在新的数据上,映射为输出结果,使得模型具有预知能力。
无监督没有训练过程,直接拿数据进行建模分析。
有监督的核心是分类,无监督的核心是聚类。有监督的工作是选择分类器和确定权值,无监督的工作是密度估计,即只要知道如何计算相似度就行了。
有监督不具备降维的能力,无监督主要用于提取特征,减少数据特征的维度。可以理解为以某种平均-保留的方式压缩数据(PCA、SVD),然后送入神经网络等监督学习算法。
有监督在输出结果的同时也被贴上标签表明是好是坏,无监督的结果只是一群一群的聚类,比如一个外行要处理一堆药材,他只能把看上去像的聚为一堆,如果要进一步在一堆里边进行分类就需要老中医了。因此无监督属于先聚类后定性。
有监督和无监督算法的选择:独立分布数据更适合有监督,非独立数据更适合无监督。
自编码、聚类、PCA、随机森林、GAN等都属于无监督学习。
有监督学习及无监督学习的区别
最新推荐文章于 2024-04-18 16:46:53 发布