周志华《机器学习》第一章课后习题

最新推荐文章于 2023-04-24 17:28:09 发布

An efforter

最新推荐文章于 2023-04-24 17:28:09 发布

阅读量3.6k

点赞数 7

文章标签： python

本文链接：https://blog.csdn.net/qq_40694323/article/details/124110292

版权

1.1、在下面这张图片中若只包含编号为1和4的两个样例，试给出相应的版本空间。

分析：什么叫版本空间？

现实问题中我们常面临很大的假设空间,但学习过程是基于有限样本训练集进行的,因此,可能有多个假设与训练集一致，即存在着一个与训练集一致的“假设集合”，我们称之为“版本空间”(version space).例如，在西瓜问题中,与表1.1训练集所对应的版本空间如图1.2所示.注意的是

表1.1的训练数据集对应的假设空间应该如下：
1 色泽＝＊，根蒂＝＊，敲声＝＊
2 色泽＝青绿，根蒂＝＊，敲声＝＊
3 色泽＝乌黑，根蒂＝＊，敲声＝＊
4 色泽＝＊，根蒂＝蜷缩，敲声＝＊
5 色泽＝＊，根蒂＝硬挺，敲声＝＊
6 色泽＝＊，根蒂＝稍蜷，敲声＝＊
7 色泽＝＊，根蒂＝＊，敲声＝浊响
8 色泽＝＊，根蒂＝＊，敲声＝清脆
9 色泽＝＊，根蒂＝＊，敲声＝沉闷
10 色泽＝青绿，根蒂＝蜷缩，敲声＝＊
11 色泽＝青绿，根蒂＝硬挺，敲声＝＊
12 色泽＝青绿，根蒂＝稍蜷，敲声＝＊
13 色泽＝乌黑，根蒂＝蜷缩，敲声＝＊
14 色泽＝乌黑，根蒂＝硬挺，敲声＝＊
15 色泽＝乌黑，根蒂＝稍蜷，敲声＝＊
16 色泽＝青绿，根蒂＝＊，敲声＝浊响
17 色泽＝青绿，根蒂＝＊，敲声＝清脆
18 色泽＝青绿，根蒂＝＊，敲声＝沉闷
19 色泽＝乌黑，根蒂＝＊，敲声＝浊响
20 色泽＝乌黑，根蒂＝＊，敲声＝清脆
21 色泽＝乌黑，根蒂＝＊，敲声＝沉闷
22 色泽＝＊，根蒂＝蜷缩，敲声＝浊响
23 色泽＝＊，根蒂＝蜷缩，敲声＝清脆
24 色泽＝＊，根蒂＝蜷缩，敲声＝沉闷
25 色泽＝＊，根蒂＝硬挺，敲声＝浊响
26 色泽＝＊，根蒂＝硬挺，敲声＝清脆
27 色泽＝＊，根蒂＝硬挺，敲声＝沉闷
28 色泽＝＊，根蒂＝稍蜷，敲声＝浊响
29 色泽＝＊，根蒂＝稍蜷，敲声＝清脆
30 色泽＝＊，根蒂＝稍蜷，敲声＝沉闷
31 色泽＝青绿，根蒂＝蜷缩，敲声＝浊响
32 色泽＝青绿，根蒂＝蜷缩，敲声＝清脆
33 色泽＝青绿，根蒂＝蜷缩，敲声＝沉闷
34 色泽＝青绿，根蒂＝硬挺，敲声＝浊响
35 色泽＝青绿，根蒂＝硬挺，敲声＝清脆
36 色泽＝青绿，根蒂＝硬挺，敲声＝沉闷
37 色泽＝青绿，根蒂＝稍蜷，敲声＝浊响
38 色泽＝青绿，根蒂＝稍蜷，敲声＝清脆
39 色泽＝青绿，根蒂＝稍蜷，敲声＝沉闷
40 色泽＝乌黑，根蒂＝蜷缩，敲声＝浊响
41 色泽＝乌黑，根蒂＝蜷缩，敲声＝清脆
42 色泽＝乌黑，根蒂＝蜷缩，敲声＝沉闷
43 色泽＝乌黑，根蒂＝硬挺，敲声＝浊响
44 色泽＝乌黑，根蒂＝硬挺，敲声＝清脆
45 色泽＝乌黑，根蒂＝硬挺，敲声＝沉闷
46 色泽＝乌黑，根蒂＝稍蜷，敲声＝浊响
47 色泽＝乌黑，根蒂＝稍蜷，敲声＝清脆
48 色泽＝乌黑，根蒂＝稍蜷，敲声＝沉闷
49 Ø
列出来所有的假设空间。

以下进行学习过程，就是：可以不断删除与正例不一致的假设、和(或)与反例一致的假设．最终将会获得与训练集一致：

1）.（色泽＝青绿、根蒂＝蜷缩、敲声＝浊响），好瓜

可以删除假设空间中的3、5、6、8、9、11-15、17-21、23-30、32-49

2）. （色泽＝乌黑、根蒂＝蜷缩、敲声＝浊响），好瓜）

可以删除剩余假设空间中的2、10、16、31

3). （色泽＝青绿、根蒂＝硬挺、敲声＝清脆），坏瓜）

可以删除剩余假设空间中的1

4). （色泽＝乌黑、根蒂＝稍蜷、敲声＝沉闷），坏瓜）
剩余假设空间中无可删除的假设

学习过后剩余的假设为
4 色泽＝＊，根蒂＝蜷缩，敲声＝＊
7 色泽＝＊，根蒂＝＊，敲声＝浊响
22 色泽＝＊，根蒂＝蜷缩，敲声＝浊响
这就是最后的“假设集合”，也就是“版本空间”。

解答：

西瓜1（（色泽＝青绿、根蒂＝蜷缩、敲声＝浊响），好瓜））为正例
找到与它不一致的假设：3、5、6、8、9、11-15、17-21、23-30、32-49
西瓜4（（色泽＝乌黑、根蒂＝稍蜷、敲声＝沉闷），坏瓜））为反例
找到与它一致的假设：1,、3、6、9、15、21、30、48
所以在搜索过程中删除的假设有：1、3、5、6、8、9、11-15、17-21、23-30、32-49
剩下的假设有为：2、4、7、10、16、22、31
所以，所求版本空间为：{2、4、7、10、16、22、31}

1.2、

从这些概念看来，确实很懵逼。

什么叫单个合取式、析合范式？

析合范式(disjunctive normal form)亦称析取范式一种析取式。是若干简单合取式的析取式。

解答：

由题1.1知，共有49种假设，其中：
全部不泛化 2∗3∗3=182∗3∗3=18种假设；
一个属性泛化：2∗3+3∗3+2∗3=21种假设；
两个属性泛化：2+3+3=82+3+3=8种假设；
三属性泛化：1种假设
空集：1种假设
不考虑空集，则有48种假设，所以k的最大值为48。
泛化的不算，因为泛化的会早造成一定的重复性，于是乎最基本的就是18中假设，18个合取式进行析取，结果为2^18 - 1

这里借鉴下面大佬的博客，首先表示感谢。
(58条消息) 周志华《机器学习》习题答案（不断更新中）_不一样的天蝎座的博客-CSDN博客_机器学习答案