在机器学习和人工智能领域,相信大家都会非常了解机器学习可以分为有监督学习、无监督学习,或许中间再加一个半监督学习。我们也知道,目前大部分的有效和高精确度的学习方法都是使用有监督的学习方法来实现的。关于有监督,无监督和半监督的机器学习方法可以参考这篇文章《The 10 Algorithms Machine Learning Engineers Need to Know 》,同时,提供文章中提到的一本经典书籍之一:Peter Norvig教授的《人工智能——一种现代方法》。
传统的无监督学习基本就是大家熟知的机器学习方法,例如聚类算法,主成分分析,支持向量机等,而这些传统机器学习方法更多的是基于统计学方法,而且没有反馈能力,以SVM为例,最容易出现的情况可能是过拟合,在训练数据集上的效果很好,但是换了数据集之后,效果会明显低于原来的效果,还有第二个容易出现的问题是训练集和测试机(实际运行环境)的正负数据比例越接近越好。因为这两点,导致在真实环境中,无监督的效果和适应性都并不是很高。