简单来说,监督学习是我们来教计算机做某些事情,
无监督学习是计算机自己学习做某件事情。
更直白讲,监督学习是我们输入一个包含正确答案的数据集,然后让机器总结出通用规律,当我们输入其他数据的时候,计算机可以预测出这些数据的正确答案。监督学习包括回归问题和分类问题。
回归问题:是指我们设法预测出连续值的属性。
分类问题:我们设法预测出一个离散值的输出。
无监督学习则是输入具有相同标签或没有标签的数据集,然后通过聚类算法,找出所谓的正确答案。典型的例子就是聚类算法,把一些具有类似的自动地分成一个个簇。比如谷歌新闻每天收集几十万条新闻,根据内容做成不同的新闻专栏。