版本空间

版本空间是西瓜书第一章中提到的概念,说版本空间之前,首先要了解一下基本概念

以书中习题1.1为例,数据集为:

编号色泽根蒂敲声好瓜
1青绿蜷缩浊响
4乌黑稍蜷沉闷

 根据假设空间的定义:是样本的每个属性的可能取值进行组合得到的集合。数据集中样本有三个属性分别为:色泽、根蒂和敲声。色泽的可能值为青绿、乌黑;根蒂的可能值为蜷缩、稍蜷;敲声的可能值为浊响、沉闷。在考虑属性的可能值时还需要考虑到特殊情况, 就是结果与属性无关即无论取什么值都可以,用通配符“*”表示这种情况。还有另一种极端情况就是没有“好瓜”这样的概念,用∅表示这种情况这样就有(2+1)*(2+1)*(2+1)+1=28种。所以假设空间如下:

(01)(色泽=青绿)^(根蒂=蜷缩)^(敲声=浊响)
(02)(色泽=青绿)^(根蒂=蜷缩)^(敲声=沉闷)
(03)(色泽=青绿)^(根蒂=蜷缩)^(敲声= * )

(04)(色泽=青绿)^(根蒂=稍蜷)^(敲声=浊响)
(05)(色泽=青绿)^(根蒂=稍蜷)^(敲声=沉闷)
(06)(色泽=青绿)^(根蒂=稍蜷)^(敲声= * )

(07)(色泽=青绿)^(根蒂= * )^(敲声=浊响)
(08)(色泽=青绿)^(根蒂= * )^(敲声=沉闷)
(09)(色泽=青绿)^(根蒂= * )^(敲声= * )

(10)(色泽=乌黑)^(根蒂=蜷缩)^(敲声=浊响)
(11)(色泽=乌黑)^(根蒂=蜷缩)^(敲声=沉闷)
(12)(色泽=乌黑)^(根蒂=蜷缩)^(敲声= * )

(13)(色泽=乌黑)^(根蒂=稍蜷)^(敲声=浊响)
(14)(色泽=乌黑)^(根蒂=稍蜷)^(敲声=沉闷)
(15)(色泽=乌黑)^(根蒂=稍蜷)^(敲声= * )

(16)(色泽=乌黑)^(根蒂= * )^(敲声=浊响)
(17)(色泽=乌黑)^(根蒂= * )^(敲声=沉闷)
(18)(色泽=乌黑)^(根蒂= * )^(敲声= * )

(19)(色泽= * )^(根蒂=蜷缩)^(敲声=浊响)
(20)(色泽= * )^(根蒂=蜷缩)^(敲声=沉闷)
(21)(色泽= * )^(根蒂=蜷缩)^(敲声= * )

(22)(色泽= * )^(根蒂=稍蜷)^(敲声=浊响)
(23)(色泽= * )^(根蒂=稍蜷)^(敲声=沉闷)
(24)(色泽= * )^(根蒂=稍蜷)^(敲声= * )

(25)(色泽= * )^(根蒂= * )^(敲声=浊响)
(26)(色泽= * )^(根蒂= * )^(敲声=沉闷)
(27)(色泽= * )^(根蒂= * )^(敲声= * )

(28)∅

版本空间就是在假设空间中进行搜索,然后删除假设空间中与正例不匹配的假设、或与反例匹配的假设。最终获得的假设集合即为版本空间。下面开始确定版本空间。

1.根据样本可以知道“好瓜”的概念是存在的没所以先删除假设(28)。

2.删除与正例“好瓜”不一致的假设。

根据1号样本,(色泽=青绿)^(根蒂=蜷缩)^(敲声=浊响)->好瓜为正例,删除与之不匹配的假设:(02)、(04)-(06)、(08)、(10)-(18)、(20)、(22)-(24)、(26)。

此时假设空间为:
 

(01)(色泽=青绿)^(根蒂=蜷缩)^(敲声=浊响)
(03)(色泽=青绿)^(根蒂=蜷缩)^(敲声= * )

(07)(色泽=青绿)^(根蒂= * )^(敲声=浊响)
(09)(色泽=青绿)^(根蒂= * )^(敲声= * )

(19)(色泽= * )^(根蒂=蜷缩)^(敲声=浊响)
(21)(色泽= * )^(根蒂=蜷缩)^(敲声= * )

(25)(色泽= * )^(根蒂= * )^(敲声=浊响)
(27)(色泽= * )^(根蒂= * )^(敲声= * )

3.根据2号样本,(色泽=乌黑)^(根蒂=稍蜷)^(敲声=沉闷)->坏瓜为反例,删除与之匹配的假设:(27)。

最后的假设空间为:

(01)(色泽=青绿)^(根蒂=蜷缩)^(敲声=浊响)
(03)(色泽=青绿)^(根蒂=蜷缩)^(敲声= * )

(07)(色泽=青绿)^(根蒂= * )^(敲声=浊响)
(09)(色泽=青绿)^(根蒂= * )^(敲声= * )

(19)(色泽= * )^(根蒂=蜷缩)^(敲声=浊响)
(21)(色泽= * )^(根蒂=蜷缩)^(敲声= * )

(25)(色泽= * )^(根蒂= * )^(敲声=浊响)

此假设空间即为版本空间。

  • 3
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值