(三)机器学习的类型
机器学习根据训练方法的不同可以分为三类,监督学习、无监督学习、强化学习。
监督学习和人类的学习过程很相似,
1)选择一个练习题,运用已有的知识去解决它,将答案和正确答案进行比较;
2)如果答案不对,换一种方法;
3)重复1和2直到解决所有的问题。
机器学习和这个例子类比,练习题和答案对应于训练数据,知识对应于模型。重要的是我们需要一个正确答案,这是监督学习的一个重点。就像是老师给学生提供解法一样。
在监督学习中,每一个训练数据集包含输入数据和与之对应的正确的输出数据。对于同样的输入数据,监督学习就是不断的修正模型,尽可能使实际输出数据和正确的输出数据相同。相反,无监督学习就是只有输入数据,而没有对应的正确输出数据。
无监督学习通常用在研究数据的特性和对数据进行预处理上,就像学生只能通过结构和特性对问题进行分类,但无法解决它,因为学生没有正确答案。
强化学习有输入数据,输出数据和数据的等级,它通常用在一些需要最佳交互的情形下,比如控制和游戏。
这本书只使用监督学习,比起无监督学习和强化学习,监督学习运用范围更广。
1 分类与回归
监督学习里常用的两个概念是分类与回归。
先说分类,分类是机器学习里普遍的应用,例如将数据分类。举一些例子,
垃圾邮件过滤➔按常规邮件或垃圾邮件分类;
数字识别➔将数字分为0-9;
面部识别➔将人脸按照不同用户分类;
在分类问题中,我们想知道输入数据属于哪一类,所以正确的输出数据就是相对应的类别。回到之前点的形状分类的问题,我们想要建立的模型是通过输入不同的坐标,判断点属于圆形还是三角形。
![](https://img-blog.csdnimg.cn/20200219151427682.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3h1YW55aW5pbmc=,size_16,color_FFFFFF,t_70)
可以列出训练数据集N,如下图所示。
![](https://img-blog.csdnimg.cn/20200219151427651.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3h1YW55aW5pbmc=,size_16,color_FFFFFF,t_70)
与分类不同,回归不会对数据分类,它对值进行估计,例如,现在有年龄和收入的数据集,希望建立一个年龄和收入之间关系的模型,这就是一个回归问题。
![](https://img-blog.csdnimg.cn/20200219151427647.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3h1YW55aW5pbmc=,size_16,color_FFFFFF,t_70)
分类和回归都属于监督学习,不同的是,分类的正确输出是类别,而回归的正确输出是值,可以估计数据的趋势。作为参考,无监督学习的一个典型应用是聚类,聚类判断个体数据的特征,并对相关数据进行分类,但它和分类是两种完全不同的方法,很容易混淆。