一、假设空间 版本空间
根据P4表1.1和P5图1.1得,
假设空间为:
1 色泽=*, 根蒂=*, 敲声=*
2 色泽=青绿, 根蒂=*, 敲声=*
3 色泽=乌黑, 根蒂=*, 敲声=*
4 色泽=*, 根蒂=蜷缩,敲声=*
5 色泽=*, 根蒂=硬挺,敲声=*
6 色泽=*, 根蒂=稍蜷,敲声=*
7 色泽=*, 根蒂=*, 敲声=浊响
8 色泽=*, 根蒂=*, 敲声=清脆
9 色泽=*, 根蒂=*, 敲声=沉闷
10 色泽=青绿,根蒂=蜷缩,敲声=*
11 色泽=青绿,根蒂=硬挺,敲声=*
12 色泽=青绿,根蒂=稍蜷,敲声=*
13 色泽=乌黑,根蒂=蜷缩,敲声=*
14 色泽=乌黑,根蒂=硬挺,敲声=*
15 色泽=乌黑,根蒂=稍蜷,敲声=*
16 色泽=青绿,根蒂=*, 敲声=浊响
17 色泽=青绿,根蒂=*, 敲声=清脆
18 色泽=青绿,根蒂=*, 敲声=沉闷
19 色泽=乌黑,根蒂=*, 敲声=浊响
20 色泽=乌黑,根蒂=*, 敲声=清脆
21 色泽=乌黑,根蒂=*, 敲声=沉闷
22 色泽=*, 根蒂=蜷缩,敲声=浊响
23 色泽=*, 根蒂=蜷缩,敲声=清脆
24 色泽=*, 根蒂=蜷缩,敲声=沉闷
25 色泽=*, 根蒂=硬挺,敲声=浊响
26 色泽=*, 根蒂=硬挺,敲声=清脆
27 色泽=*, 根蒂=硬挺,敲声=沉闷
28 色泽=*, 根蒂=稍蜷,敲声=浊响
29 色泽=*, 根蒂=稍蜷,敲声=清脆
30 色泽=*, 根蒂=稍蜷,敲声=沉闷
31 色泽=青绿,根蒂=蜷缩,敲声=浊响
32 色泽=青绿,根蒂=蜷缩,敲声=清脆
33 色泽=青绿,根蒂=蜷缩,敲声=沉闷
34 色泽=青绿,根蒂=硬挺,敲声=浊响
35 色泽=青绿,根蒂=硬挺,敲声=清脆
36 色泽=青绿,根蒂=硬挺,敲声=沉闷
37 色泽=青绿,根蒂=稍蜷,敲声=浊响
38 色泽=青绿,根蒂=稍蜷,敲声=清脆
39 色泽=青绿,根蒂=稍蜷,敲声=沉闷
40 色泽=乌黑,根蒂=蜷缩,敲声=浊响
41 色泽=乌黑,根蒂=蜷缩,敲声=清脆
42 色泽=乌黑,根蒂=蜷缩,敲声=沉闷
43 色泽=乌黑,根蒂=硬挺,敲声=浊响
44 色泽=乌黑,根蒂=硬挺,敲声=清脆
45 色泽=乌黑,根蒂=硬挺,敲声=沉闷
46 色泽=乌黑,根蒂=稍蜷,敲声=浊响
47 色泽=乌黑,根蒂=稍蜷,敲声=清脆
48 色泽=乌黑,根蒂=稍蜷,敲声=沉闷
49 Ø
2 色泽=青绿, 根蒂=*, 敲声=*
3 色泽=乌黑, 根蒂=*, 敲声=*
4 色泽=*, 根蒂=蜷缩,敲声=*
5 色泽=*, 根蒂=硬挺,敲声=*
6 色泽=*, 根蒂=稍蜷,敲声=*
7 色泽=*, 根蒂=*, 敲声=浊响
8 色泽=*, 根蒂=*, 敲声=清脆
9 色泽=*, 根蒂=*, 敲声=沉闷
10 色泽=青绿,根蒂=蜷缩,敲声=*
11 色泽=青绿,根蒂=硬挺,敲声=*
12 色泽=青绿,根蒂=稍蜷,敲声=*
13 色泽=乌黑,根蒂=蜷缩,敲声=*
14 色泽=乌黑,根蒂=硬挺,敲声=*
15 色泽=乌黑,根蒂=稍蜷,敲声=*
16 色泽=青绿,根蒂=*, 敲声=浊响
17 色泽=青绿,根蒂=*, 敲声=清脆
18 色泽=青绿,根蒂=*, 敲声=沉闷
19 色泽=乌黑,根蒂=*, 敲声=浊响
20 色泽=乌黑,根蒂=*, 敲声=清脆
21 色泽=乌黑,根蒂=*, 敲声=沉闷
22 色泽=*, 根蒂=蜷缩,敲声=浊响
23 色泽=*, 根蒂=蜷缩,敲声=清脆
24 色泽=*, 根蒂=蜷缩,敲声=沉闷
25 色泽=*, 根蒂=硬挺,敲声=浊响
26 色泽=*, 根蒂=硬挺,敲声=清脆
27 色泽=*, 根蒂=硬挺,敲声=沉闷
28 色泽=*, 根蒂=稍蜷,敲声=浊响
29 色泽=*, 根蒂=稍蜷,敲声=清脆
30 色泽=*, 根蒂=稍蜷,敲声=沉闷
31 色泽=青绿,根蒂=蜷缩,敲声=浊响
32 色泽=青绿,根蒂=蜷缩,敲声=清脆
33 色泽=青绿,根蒂=蜷缩,敲声=沉闷
34 色泽=青绿,根蒂=硬挺,敲声=浊响
35 色泽=青绿,根蒂=硬挺,敲声=清脆
36 色泽=青绿,根蒂=硬挺,敲声=沉闷
37 色泽=青绿,根蒂=稍蜷,敲声=浊响
38 色泽=青绿,根蒂=稍蜷,敲声=清脆
39 色泽=青绿,根蒂=稍蜷,敲声=沉闷
40 色泽=乌黑,根蒂=蜷缩,敲声=浊响
41 色泽=乌黑,根蒂=蜷缩,敲声=清脆
42 色泽=乌黑,根蒂=蜷缩,敲声=沉闷
43 色泽=乌黑,根蒂=硬挺,敲声=浊响
44 色泽=乌黑,根蒂=硬挺,敲声=清脆
45 色泽=乌黑,根蒂=硬挺,敲声=沉闷
46 色泽=乌黑,根蒂=稍蜷,敲声=浊响
47 色泽=乌黑,根蒂=稍蜷,敲声=清脆
48 色泽=乌黑,根蒂=稍蜷,敲声=沉闷
49 Ø
图1.1下面的那段话描述了学习的过程:搜索过程中可以不断删除与正例(好瓜)不一致的假设、和(或)与反例(坏瓜)一致的假设。最终将会获得与训练集一致(即对所有训练样本能够进行正确判断)的假设,这就是我们学得的结果。
4 色泽=*,根蒂=蜷缩,敲声=*
7 色泽=*,根蒂=*,敲声=浊响
22 色泽=*,根蒂=蜷缩,敲声=浊响
按照上述过程进行学习:
(1)(色泽=青绿、根蒂=蜷缩、敲声=浊响),好瓜 【此处保留非*号内容与(1)对应位置取值相同的假设】
保留1、2、4、7、10、16、22、31
(2)(色泽=乌黑、根蒂=蜷缩、敲声=浊响),好瓜
保留1、4、7、22
(3)(色泽=青绿、根蒂=硬挺、敲声=清脆),坏瓜
删除1
(4)(色泽=乌黑、根蒂=稍蜷、敲声=沉闷),坏瓜
剩余假设空间中无可删除的假设
4 色泽=*,根蒂=蜷缩,敲声=*
7 色泽=*,根蒂=*,敲声=浊响
22 色泽=*,根蒂=蜷缩,敲声=浊响
这就是最后的“假设集合”,也就是“版本空间”。
二、查全率 查准率
Machine learning 中查准率(Precision)、查全率(recall)和Accuracy。
表示分类正确:
True Positive:本来是正样例,分类成正样例。
False Positive :本来是负样例,分类成正样例,通常叫误报。
表示分类正确:
True Positive:本来是正样例,分类成正样例。
True Negative:本来是负样例,分类成负样例。
(据个人的理解,TP和TN的损失为0,一般它们的数量不变)
表示分类错误:False Positive :本来是负样例,分类成正样例,通常叫误报。
False Negative:本来是正样例,分类成负样例,通常叫漏报。
P=TP/(TP+FP)
R=TP/(TP+FN)
从实际意义来讲,
P可以看出是否有被误报的情况,。
R可以看出是否有被漏报的情况。