第一章 绪论
一 基本概念
**1.假设空间:**为每种属性取任一属性值,将所有属性取值数相乘,加上一种特殊的假设,即不存在正样本,罗列以上所有取值组合构成样本的假设空间。
**2.版本空间:**从一般到特殊或是从特殊到一般对整个假设空间进行搜索,删除与正例不一致的假设,或与反例一致的假设,最终得到样本的版本空间
**3.奥卡姆剃刀:**若有多个假设与观察一致,则选最简单那个。
第二章 模型评估与选择
一 基本概念
错误率:分类错误的样本除以总样本数。
精度(正常率)=1-错误率
训练误差即经验误差
新样本误差为泛化误差
二 数据集划分方法
留出法
交叉验证法
自助法:在一个有m个样本的数据集D中,每次随机抽取一个样本放到C中,重复执行m次,获得有m个样本的集合作为训练集。
三 模型评估指标