题目:
1.1 表1.1中若只包含编号为1和4的两个样例,试给出相应的版本空间。
表1.1
编号 | 色泽 | 根蒂 | 敲声 | 好瓜 |
---|---|---|---|---|
1 | 青绿 | 蜷缩 | 浊响 | 是 |
4 | 乌黑 | 稍蜷 | 沉闷 | 否 |
首先得理解版本空间的概念:即存在一个与训练集一致的“假设集合”
简单说就是我们要得到的这个版本空间是从所有的假设中删除和正例(色泽:青绿;根蒂:蜷缩;敲声:浊响)不一致的或与反例(色泽:乌黑;根蒂:稍蜷;敲声:沉闷)一致的假设
然后用我最开始想到的最笨的方法,列出所有的假设
正例(属性值定为1)反例(属性值定为0)*通配符(取什么值都合适)
这个样本空间规模算法
(※+1+0)X(※+1+0)X(※+1+0)+1 = 3 x 3 x 3 + 1 = 28(种)
\times序号 | 色泽 | 根蒂 | 敲声 | 好瓜 |
---|---|---|---|---|
1 | 1 | 1 | 1 | 1 |
2 | 1 | 1 | 0 | 0 |
3 | 1 | 0 | 0 | 0 |
4 | 1 | 0 | 1 | 0 |
5 | 0 | 0 | 0 | 0 |
6 | 0 | 0 | 1 | 0 |
7 | 0 | 1 | 1 | 0 |
8 | 0 | 1 | 0 | 0 |
9 | * | 1 | 1 | 1 |
10 | * | 1 | 0 | 0 |
11 | * | 0 | 0 | 0 |
12 | * | 0 | 1 | 0 |
13 | 1 | * | 0 | 0 |
14 | 1 | * | 1 | 1 |
15 | 0 | * | 0 | 0 |
16 | 0 | * | 1 | 0 |
17 | 1 | 1 | * | 1 |
18 | 1 | 0 | * | 0 |
19 | 0 | 0 | * | 0 |
20 | 0 | 1 | * | 0 |
21 | * | * | 1 | 1 |
22 | * | * | 0 | 0 |
23 | * | 1 | * | 1 |
24 | * | 0 | * | 0 |
25 | 1 | * | * | 1 |
26 | 0 | * | * | 0 |
27 | * | * | * | 0 |
28 | - | - | - | 0(恒为假) |
当然列表这种笨办法只适用于规模小的,所以我们再用算式来解答
我们只需要考虑和正例相符的假设
即(※+1)X(※+1)X(※+1)- 1 = 2 x 2 x 2 - 1 = 7(种)
备注:这里减掉的1,是(色泽: ;根蒂:* ;敲声:* )这种假设*
是好瓜的假设有7种,就可得出相应的版本空间