《西瓜书》中举了大量的举例,但是有些例子讲的并不清楚,所以很多书友在跟着《西瓜书》学习的时候可能看的会比较吃力。在看到《西瓜书》15章第4小节一阶强化学习中所举的例子(如上图)时,相信很多书友对这个例子中的16、18、25、50这些数字是哪里来的很迷茫,所以这篇文章会对这个例子展开说说,因为这部分的解释有些饶人,所以我也只能尽我所能去用文字阐述清楚,如果有误还请见谅,本人虚心接受来自各位“看官”的批评指正。当然,如果这篇文章还能入得了各位“看官”的法眼,麻烦点赞、关注、收藏,支持一下!
在进入正文之前,先对一些注意事项进行说明:
1、此处的样例指的是"关系数据样例",具体来说就是指“更好(X,Y)”、“非更好(X,Y)”,而不是“好瓜”,“坏瓜”这些【注意:“色泽更深(X,Y)”不算是“关系数据样例”】
2、新规则覆盖的正例和反例指的是什么?——举例说明,规则1:色泽更深(X,Y)→更好(X,Y),则正例是指满足条件色泽更深(X,Y)的关系数据样例更好(X,Y),反例是指满足条件色泽更深(X,Y)的关系数据样例非更好(X,Y),所有正例和反例所构成的集合就是规则1所对应的“规则集”
3、《西瓜书》所举的这个例子中,新规则是:色泽更深(X,Y)→更好(X,Y)
现在进入正文
《西瓜书》中的原数据集如下:
《西瓜书》对西瓜数据的定义如下:
为了帮助大家更好的理解这个例子,根据《西瓜书》中的原数据集以及对西瓜数据的定义,我将“新规则”所涉及的“关系数据集”都列了出来,如下图所示:
其中“更好”、“非更好”下面的所有“关系数据样例”是本例中“空规则体”所对应的样例,且“更好(X,Y)”对应的是正例,“非更好(X,Y)”对应的是反例,因此,由上图,我们可以知道在“空规则体”中,正例数=反例数=25,正例数+反例数=50。
在“更好”、“非更好”下面的黄色高亮和红色高亮部分所对应的“关系数据样例”所组成的集合是“新规则”所对应的“规则集”,且黄色高亮的“关系数据样例”是“新规则”所覆盖的正例,红色高亮的“关系数据样例”是“新规则”所覆盖的反例,因此,由上图,我们可以知道在“新规则体”中,正例数=16,反例数=2,正例数+反例数=18
可能有些小伙伴可能仍有一些疑惑:你在“色泽更深”下面列了那么多,为什么“色泽更深(2,1)”、“色泽更深(2,6)”这些你都没算进去?——因为不存在关系数据样例“更好(2,1)”以及“非更好(2,1)”