《机器学习》(周志华) 第一章 绪论 的课后习题1.2
本文的目的主要是将自己对此题的解题思路分享一下,若有误,望指出,谢谢。
先上题目:
1.2 与使用单个合取式来进行假设表示相比,使用“析合范式”将使得假设空间具有更强的表示能力。例如
好瓜<—>((色泽=*)^(根蒂=蜷缩)^(敲声=*))
((色泽=乌黑)^(根蒂=*)^(敲声=清脆)),
会把“(色泽=青绿)(根蒂=蜷缩)(敲声=沉闷)”以及“(色泽=乌黑)(根蒂=硬挺)(敲声=沉闷)”都分类
为“好瓜”。若使用最多包含k个合取式的析合范式来表达下表西瓜分类问题的假设空间,试估算共有多少种可能的假设。
编号 | 色泽 | 根蒂 | 敲声 | 好瓜 |
1 | 青绿 | 蜷缩 | 浊响 | 是 |
2 | 乌黑 | 蜷缩 | 浊响 | 是 |
3 | 青绿 | 硬挺 | 清脆 | 是 |
4 | 乌黑 | 稍蜷 | 沉闷 | 否 |
解答:
在上表中,“色泽”、“根蒂”、“敲声”分别有2、3、3种可能取值,各个属性的取值再加上“通配”(无论取什么值都合适),另外,再加一种可能 ——“好瓜”这种东西不存在(空集表示),则上表所对应的假设空间的规模大小为3x4x4+1=49。 依上表,“好瓜”的概念已存在,故以下分析中先不考虑空集那一项(只考虑剩下的48种)。在48种假设中:
具体假设: 2x3x3=18 种
一个通配符:2x3+3x3+2x3=21种
两个通配符:2+3+3=8 种
三个通配符:1种
当然,在以上的48种假设中,每条具体假设都会对应的包含在某条含通配符的假设中 或 每条含数量少的通配符的假设都会对应的包含在某条含数量多的通配符的假设中,例如:
((色泽=青绿)^(根蒂=蜷缩)^(敲声=浊响))就包含在 ((色泽=*)^(根蒂=蜷缩)^(敲声=清脆))中,此时会涉及到冗余。
1)若不考虑冗余,k最大取值为48
k=1时,共 种;
k=2时,共 种;
... ...
k=n时,共 种;
... ...
k=48时,共 种;
所有k的取值的结果的可能共 种。
2)若考虑冗余,k最大取值为18
k=1时,共 种;
k=2时,共 种;
... ...
k=n时,共 种;
... ...
k=48时,共 种;
所有k的取值的结果的可能共 种。