和之前我接触的机器学习书籍相比,这本书有以下几个特点:
1)逻辑清晰
2)举例清楚
3)对特定的专业名词,在给出其中文的同时,也给了相应的英文词汇
4)使用了数学来描述
5)特别喜欢用西瓜举例
我学到的新知识点有:
1)假设空间。
按我的理解,简单来说,就是所有属性可能的取值的笛卡儿积。与尝试不同的是,若某一个或多个属性在一定条件下,无论取什么值都不影响分类结果时,我们把它单独给定一个值,记为*。
在现实问题时,因为一些属性间具有相关性(比如动物不可能既没有翅膀,又能飞行),或该问题并不研究全域上的分类,所有我们只需要特定的一些组合即可。即我们只需要假设空间的子集合,称之为版本空间。
2)归纳偏好
当运行机器学习算法后,它可能会形成多个与训练集一致的假设,那么当面对新样本时,有可能出现“其中一些假设给出的结果与其它假设给出的不同”的问题。但是我们又必须得到一个确定的结果,因此我们需要设定特别的规则(即偏好),来选择最合适的假设作为结果。
3)NFL定理
这个定理有一个反直觉的结论:无论是认真设计还是随手乱画出来的分类算法,其期望的分类性能是一样的。
这看上去很令人沮丧,不过考虑到它成立的前提:所有问题同等重要,而实际中,我们只关心自己的问题。于是我们就领悟了这样一个道理:没有最好的算法,只有最合适的算法。算法需要随着问题的需求,进行灵活的改变。
发展历程
1)推理期
这一阶段的人工智能仅具备逻辑推理能力。
2)知识期
人类总结并传授给人工智能知识,然而这一过程比较艰难。
3)机器学习期
在这一时期,人类不再传授给计算机知识,而是以形成知识的能力代替之。这一时期有很多算法,后续章节会一一介绍。
后面就是机器学习的应用和推荐文献了,没有什么介绍的必要了。