机器学习周志华第一章课后习题

小白*进阶ing

已于 2022-09-13 19:42:35 修改

阅读量1.6k

点赞数 1

分类专栏：机器学习周志华课后习题文章标签：机器学习人工智能 python

于 2022-09-09 22:21:10 首次发布

本文链接：https://blog.csdn.net/qq_44948213/article/details/126789461

版权

机器学习周志华课后习题专栏收录该内容

1 篇文章 0 订阅

订阅专栏

机器学习周志华第一章课后习题

1.1

在下面这张图片中若只包含编号为1和4的两个样例，试给出相应的版本空间。

在这里插入图片描述

书上实例：

1、表 1.1 对应的假设空间如下：

1. 色泽＝＊，根蒂＝＊，敲声＝＊
2. 色泽＝青绿，根蒂＝＊，敲声＝＊
3. 色泽＝乌黑，根蒂＝＊，敲声＝＊
4. 色泽＝＊，根蒂＝蜷缩，敲声＝＊
5. 色泽＝＊，根蒂＝硬挺，敲声＝＊
6. 色泽＝＊，根蒂＝稍蜷，敲声＝＊
7. 色泽＝＊，根蒂＝＊，敲声＝浊响
8. 色泽＝＊，根蒂＝＊，敲声＝清脆
9. 色泽＝＊，根蒂＝＊，敲声＝沉闷
10. 色泽＝青绿，根蒂＝蜷缩，敲声＝＊
11. 色泽＝青绿，根蒂＝硬挺，敲声＝＊
12. 色泽＝青绿，根蒂＝稍蜷，敲声＝＊
13. 色泽＝乌黑，根蒂＝蜷缩，敲声＝＊
14. 色泽＝乌黑，根蒂＝硬挺，敲声＝＊
15. 色泽＝乌黑，根蒂＝稍蜷，敲声＝＊
16. 色泽＝青绿，根蒂＝＊，敲声＝浊响
17. 色泽＝青绿，根蒂＝＊，敲声＝清脆
18. 色泽＝青绿，根蒂＝＊，敲声＝沉闷
19. 色泽＝乌黑，根蒂＝＊，敲声＝浊响
20. 色泽＝乌黑，根蒂＝＊，敲声＝清脆
21. 色泽＝乌黑，根蒂＝＊，敲声＝沉闷
22. 色泽＝＊，根蒂＝蜷缩，敲声＝浊响
23. 色泽＝＊，根蒂＝蜷缩，敲声＝清脆
24. 色泽＝＊，根蒂＝蜷缩，敲声＝沉闷
25. 色泽＝＊，根蒂＝硬挺，敲声＝浊响
26. 色泽＝＊，根蒂＝硬挺，敲声＝清脆
27. 色泽＝＊，根蒂＝硬挺，敲声＝沉闷
28. 色泽＝＊，根蒂＝稍蜷，敲声＝浊响
29. 色泽＝＊，根蒂＝稍蜷，敲声＝清脆
30. 色泽＝＊，根蒂＝稍蜷，敲声＝沉闷
31. 色泽＝青绿，根蒂＝蜷缩，敲声＝浊响
32. 色泽＝青绿，根蒂＝蜷缩，敲声＝清脆
33. 色泽＝青绿，根蒂＝蜷缩，敲声＝沉闷
34. 色泽＝青绿，根蒂＝硬挺，敲声＝浊响
35. 色泽＝青绿，根蒂＝硬挺，敲声＝清脆
36. 色泽＝青绿，根蒂＝硬挺，敲声＝沉闷
37. 色泽＝青绿，根蒂＝稍蜷，敲声＝浊响
38. 色泽＝青绿，根蒂＝稍蜷，敲声＝清脆
39. 色泽＝青绿，根蒂＝稍蜷，敲声＝沉闷
40. 色泽＝乌黑，根蒂＝蜷缩，敲声＝浊响
41. 色泽＝乌黑，根蒂＝蜷缩，敲声＝清脆
42. 色泽＝乌黑，根蒂＝蜷缩，敲声＝沉闷
43. 色泽＝乌黑，根蒂＝硬挺，敲声＝浊响
44. 色泽＝乌黑，根蒂＝硬挺，敲声＝清脆
45. 色泽＝乌黑，根蒂＝硬挺，敲声＝沉闷
46. 色泽＝乌黑，根蒂＝稍蜷，敲声＝浊响
47. 色泽＝乌黑，根蒂＝稍蜷，敲声＝清脆
48. 色泽＝乌黑，根蒂＝稍蜷，敲声＝沉闷
49. Ø

2、接下来不断删除与正例不一致(或与反例一致)的假设

色泽＝青绿、根蒂＝蜷缩、敲声＝浊响），好瓜
删除假设空间中的3、5、6、8、9、11-15、17-21、23-30、32-49
（色泽＝乌黑、根蒂＝蜷缩、敲声＝浊响），好瓜）
删除剩余假设空间中的2、10、16、31
（色泽＝青绿、根蒂＝硬挺、敲声＝清脆），坏瓜）
删除剩余假设空间中的1
（色泽＝乌黑、根蒂＝稍蜷、敲声＝沉闷），坏瓜）
剩余假设空间中无可删除的假设

3、最终假设空间为：{4、7、22}，与训练集一致：

在这里插入图片描述

习题解答：

色泽＝青绿、根蒂＝蜷缩、敲声＝浊响），好瓜
删除假设空间中的3、5、6、8、9、11-15、17-21、23-30、32-49
（色泽＝乌黑、根蒂＝稍蜷、敲声＝沉闷），坏瓜）
剩余假设空间中删除的假设 1
最终假设空间为：{2、4、7、10、16、22、31}

2. 色泽 = 青绿，根蒂 = *，敲声 = *
4. 色泽＝＊，根蒂＝蜷缩，敲声＝＊
7. 色泽＝*，根蒂＝＊，敲声＝浊响
10. 色泽＝青绿，根蒂＝蜷缩，敲声＝*
16. 色泽＝青绿，根蒂＝＊，敲声＝浊响
22. 色泽＝*，根蒂＝蜷缩，敲声＝浊响
31.  色泽＝青绿，根蒂＝蜷缩，敲声＝浊响

1.2

与使用单个合取式来进行假设表示相比，使用“析合范式”将使得假设空间具有更强的表示能力。例如好瓜 ↔ ( (色泽=) ∧ (根蒂=蜷缩) ∧ (敲声=) ) ∨ ( (色泽=乌黑) ∧ (根蒂=*) ∧ (敲声=沉闷) ) 会把“ (色泽=青绿) ∧ (根蒂=蜷缩) ∧ (敲声=清脆) ”和“ (色泽=乌黑) ∧ (根蒂=硬挺) ∧ (敲声=沉闷) ”都分类为“好瓜”。若使用最多包含 k 个合取式的析合范式来表达表1.1西瓜分类问题的假设空间，试估算共有多少种可能的假设。

详细可参考：https://zhuanlan.zhihu.com/p/355235881

1.3

若数据包含噪声，则假设空间中有可能不存在与所有训练样本都一致的假设。在此情况下，试设计一种归纳偏好用于假设选择。

在训练过程中选择满足最多样本的假设，也可以对每个假设，求得其准确率。准确率=(符合假设的条件且为好瓜的样例数量)/(符合假设的条件的样例数量)，选择准确率最高的假设。
通常认为两个数据的属性越相近，则更倾向于将他们分为同一类。若相同属性出现了两种不同的分类，则认为它属于与他最临近几个数据的属性。也可以考虑同时去掉所有具有相同属性而不同分类的数据，留下的数据就是没误差的数据，但是可能会丢失部分信息。