第一章
1.1表1.1中若只包含编号为1和4的两个样例,试给出相应的版本空间。
编号 色泽 根蒂 敲声 好瓜(标记) 1 青绿 蜷缩 浊响 是Y 4 乌黑 稍蜷 沉闷 否N
知识储备:
假设空间: 所有假设组成的空间
版本空间:与训练集一致的假设集合
从假设空间到版本空间算法大致如下:
1.删除与正例不一致的假设且删除与反例一致的假设
2.删除与正例不一致的假设
3.删除与反例一致的假设
具体选择哪种算法可以堪称是归纳偏好的范畴
解:已知数据集D中含样本1和样本4两个样本,每个样本共有三个属性,是否好瓜为标记,其中标记为好瓜的为正例,反之为反例。每个属性可能的取值都为两种,故数据集D假设空间共有(2+1)*(2+1)*(2+1)+1=28个(其中括号里加1是指通配项,总表达式加1是指没有好瓜的概念即空集)。
选取版本空间第一种算法,删