Hands on Machine Learning with Scikit-learn and TensorFlow 读书笔记
不愧是深度学习四大名著之一,个人认为非常适合入门,没有太多数学推导,问题由浅入深,主要聚焦于机器学习方法的使用。所以在这里写一本读书笔记。
Chapter 1 The Machine Learning Landscape
机器学习的定义没什么好说的,就是使计算机在没有特定程序的情况下拥有学习的能力。
机器学习系统的类型(主要从三个角度进行分类):
1.是否需要人工监督进行训练;
2.是否能递增式学习;
3.是基于比较新数据与旧数据的相似度来学习还是基于数据的分布模式来学习。
这些类型不是互相排斥的,他们可以结合使用,比如一个垃圾邮件过滤器,它是在线递增学习也是监督学习。
-
根据训练过程中的监督类型可以分为四大类:监督学习(supervised learning),非监督学习(unsupervised learning),半监督学习(semisupervised learning)和强化学习(reinforcement learning)。
对于监督学习来说,喂给算法的训练数据里应该包括每条数据的标签即该条数据的期望结果。以垃圾邮件过滤系统为例,喂给这个系统的训练数据应该包括了它的分类(即该邮件是否为垃圾邮件)。
非监督学习&#