参考:http://blog.csdn.net/by4_Luminous/article/details/53341334
1. 监督学习
训练数据中,每个样本都带有正确答案。
个人理解,这种方式有正确答案的监督或者说参照,所以称为监督学习。就好像老师提供对错指示、告知最终答案的学习过程。
学习器从训练数据中学到正确答案的决策函数 y=f(x) 用于新的数据预测。
典型任务:预测数值型数据的回归、预测分类标签的分类、预测顺序的排列
应用:手写文字识别、声音处理、图像处理、垃圾邮件分类与拦截、网页检索、基因诊断、股票预测等。
2. 无监督学习
训练数据中,每个样本都没有正确答案。
学习器自己在训练数据中找规律。就像在没有老师的情况下,学生自学的过程。 所以称为无监督学习。
典型任务:聚类(相似点)、异常检测(异常点)。
应用:人造卫星故障诊断、视频分析、社交网站解析、声音信号解析、数据可视化、监督学习的前处理工具等。
3. 半监督学习
训练数据中,少部分样本有正确答案。
学习器使用大量的没有正确答案的数据,以及同时使用有正确答案的数据,来进行模式识别工作。在有正确答案的样本帮助下,获得比只用无正确答案的样本得到的结果更好的学习效果,提高学习器的精度。是无监督学习和监督学习的结合,所以称为半监督学习。
典型任务:半监督分类,半监督回归,半监督聚类,半监督降维