读周志华的机器学习,卡在假设空间和版本空间这一块了,写一下自己的理解:
假设空间:所有属性的可能性(可能取值)组合形成的假设(假设*,*,*为好瓜),组成假设空间,以西瓜问题假设为例。色泽属性可取(青绿,乌黑,浅白,*),根蒂属性可取(蜷缩,稍蜷,硬挺,*),敲声属性可取(浊响,清脆,沉闷,*),以及好瓜假设不存在。即西瓜问题的假设空间大小为(4*4*4+1=65)
有了假设空间之后,要根据已获取的信息(数据集)来对假设空间进行剪枝。即要找到一个与训练集匹配的假设空间子集。
版本空间:书中定义为:与训练集匹配的假设空间子集称为版本空间。
前文提到的匹配有必要着重解释下:我们的假设空间写出来为,色泽青绿,根蒂蜷缩,敲声浊响的