第一章 绪论
1.1引言
了解机器学习:机器学习就是一种通过计算的手段,利用经验(数据)建立模型(学习器),对新情况(新的数据)做出判断的学问。
1.2基本术语
分类:对离散数据进行预测
回归:对连续数据进行的预测
聚类:将训练数据分组
1.3假设空间
归纳和演绎:归纳即从特例总结出适用于一般情况的规律,演绎即根据该规律对新的特殊情况进行预测和推理。机器学习利用特殊案例建立模型,故称为“归纳学习”。
假设空间:即所有假设的集合,是一个包括∅的全集。在西瓜问题下可以理解为所有的西瓜。
版本空间:与训练集一致的假设的集合。
1.4归纳偏好
如果得到了多个与训练集一致的假设,必须根据一定的原则选择一个确定的假设,使得对于一个确定的样本,始终得出确定的结论。
例如图1.3中,有两条曲线与样本点一致,则算法必须从A、B中选择一个作为偏好。