一、监督学习:我们教计算机如何去做,从数据集的角度看就是说我们获取到的数据集是经过标记的,the set of date has been labeled, 监督学习的问题可以分为两类,回归问题和分类问题。
1. 我的理解就是回归问题针对连续值,比如实数,而分类问题针对离散值,比如整数(事实上,连续值你也没法做到有限划分),而显然现实生活中的问题大部分都是离散值,所以当数值比较大时,可以把离散值看做连续值进行回归处理
二、 非监督分类:计算机自己学习如何去做,从数据集的角度看就是我们获取到的数据集未经过标记或者说标记完全一致。
举例来说,比如Google News的工作原理是首先从互联网上收集新闻,接着对这些数据集进行聚类分析,即算法自动将关于某方面的新闻合并到一起,这个过程是不需要人为教授的;
三、其他类型的学习,如增强学习和推荐系统