1.1 表1.1中若只包含编号为1和4的两个样例,试给出相应的版本空间。
编号 | 色泽 | 根蒂 | 敲声 | 好瓜 |
---|---|---|---|---|
1 | 青绿 | 蜷缩 | 浊响 | 是 |
4 | 乌黑 | 稍蜷 | 沉闷 | 否 |
解答:
首先,根据表格可知,西瓜样本的每个属性都只有两种具体的属性,然后再加上每个样本属性都可以进行泛化,也就是可以取 * ,则每个属性都有三种取值的可能,那么总的假设空间的可能为:3 * 3 *3 =27(乘法原理);再加上∅的可能,所以,满足题意的总的可能性假设空间一共有27+1 = 28 种;
而样本的版本空间则是指满足好瓜的条件的假设的集合,那么,可以根据乘法原理,好瓜只有一个样本,并且每个属性有两种可能,所以,满足好瓜的假设的可能一共有: 2 * 2 * 2 =8 种;但是其中三种属性都泛化时,此时的假设同样满足坏瓜样本的条件,因此需要从样本的版本空间中剔除。所以,最终的样本的版本空间的假设个数为:8 - 1 = 7 种;每种的假设如下:
1.2 与使用单个合取式来进行假设表示相比,使用 “析合范式” 将使得假设空间具有更强的表示能力。例如 :
好瓜 ↔ (