数据挖掘导论课后习题答案-第六章

最近在读《Introduction to Data Mining 》这本书,发现课后答案只有英文版,于是打算结合自己的理解将答案翻译一下,其中难免有错误,欢迎大家指正和讨论。侵删。

第六章

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
(a)Se = 8/10 = 0.8
Sbd = 2/10 = 0.2
Sbde = 2/10 = 0.2

(b)Cbd→e = 0.2/0.2 = 1
Ce→bd = 0.2/0.8 = 0.25

(c)Se = 4/5 = 0.8
Sbd = 5/5 = 1
Sbde = 4/5 = 0.8

(d)Cbd→e = 0.8/1 = 0.8
Ce→bd = 0.8/0.8 = 1

(e)没有明显的关系
在这里插入图片描述
在这里插入图片描述
(a)
CØ→A = SØ→A
CA→Ø = 100%
(b)
在这里插入图片描述
显然 c1 ≥ c2 ,c3 ≥c2
c2具有最低的置信度
(c)更正:假设B中的规则都有相同的支持度。
则c1 = c2 ≤ c3
c3具有最高的置信度
(d)举个反例:
在这里插入图片描述
设minconf = 50%
cA→B = 66% > minconf
cB→C = 71% > minconf
cA→C = 22% < minconf
在这里插入图片描述
(a)是反单调的。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
因为 s ( A , B , C ) ≤ s ( A , B ) 且 max ( s(A) , s(B) , s( C ) ) ≥ max ( s(A) , s(B) )
因此
在这里插入图片描述
(b)
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
因为 s ( A , B , C ) ≤ s ( A , B ) 且 max ( s(A , B) , s(A , C) , s(B , C) ) ≤ max ( s(A) , s(B) )
因此是不单调的。
(c)
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
因为 s ( A , B , C ) ≤ s ( A , B ) 且 min ( s(A) , s(B) , s( C ) ) ≤ min ( s(A) , s(B) )
因此是不单调的。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
因为 s ( A , B , C ) ≤ s ( A , B ) 且 min ( s(A , B) , s(A , C) , s(B , C) ) ≤ min ( s(A) , s(B) , s( C ) ) ≤ min ( s(A) , s(B) )
因此是不单调的。
在这里插入图片描述
(a)
在这里插入图片描述
R = 37 - 28 + 1 = 602
(b)4
(c)C36 = 20
(d){ 面包,黄油 }
(e){ 啤酒,饼干 } ,{ 面包,黄油 }
在这里插入图片描述
在这里插入图片描述
(a)
{1,2,3,4}、{1,2,3,5}、{1,2,4,5}、{1,3,4,5}、{2,3,4,5}
(b)
{1,2,3,4}、{1,2,3,5}、{1,2,4,5}、{2,3,4,5}
(c)
{1,2,3,4}

在这里插入图片描述
在这里插入图片描述
(a)
在这里插入图片描述
(b)16/32 = 50%
(c)11/32 = 34.4%
(d)5/32 = 15.6%
在这里插入图片描述
在这里插入图片描述
(a) L1 L3 L5 L9 L11
(b){ 1 4 5 } ,{ 1 5 8 } ,{ 4 5 8 }
在这里插入图片描述
(a)
在这里插入图片描述
(b)5个叶结点和4个内部结点
(c)L1 L2 L3 L4,产生{ 1 2 3 } ,{ 1 2 6 }
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
解:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
(a)
在这里插入图片描述
(b)
i.
在这里插入图片描述
ii.
在这里插入图片描述
iii.
在这里插入图片描述
iv.
在这里插入图片描述
v.
在这里插入图片描述
vi.
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
(a)e
(b)d不产生任何频繁项集
(c)a
(d)b
(e)e
在这里插入图片描述
(a)范围为0到1,当P ( B | A ) = 1 时取最大值,当 P ( B | A ) = P ( B ) 时取最小值
(b)M又可以写成:
在这里插入图片描述
因此M也增加
(c)M减小
(d)M减小
(e)不对称
(f)0
(g)不是
(h)会变
(i)不对称
在这里插入图片描述
(a)c = 0.2/0.25 = 0.8
因此是有趣的
(b)I = 0.2 / ( 0.25 × 0.9 ) = 0.889
两项之间联系不大
(c)有高置信度的规则不一定有趣
在这里插入图片描述
(a)
c = 0 : ( 0 - 1/4 × 1/4 ) / ( 1/4 × 1/4 × 3/4 × 3/4 )0.5 = -1/3
c = 1 : ( 1/4 - 1/4 × 1/4 ) / ( 1/4 × 1/4 × 3/4 × 3/4 )0.5 = 1
c = 0或1 : ( 1/16 - 1/4 × 1/4 ) / ( 1/4 × 1/4 × 3/4 × 3/4 )0.5 = 0
(b)如果不考虑分类因素的话某些有趣的结果会消失
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述在这里插入图片描述
(a)
s(A) = 0.1 , s(B) = 0.9 , s(A , B) = 0.09
I ( A , B ) = 9 , Φ( A , B ) = 0.89 , c(A→B) = 0.9 , c(B→A) = 0.9
(b)
s(A) = 0.9 , s(B) = 0.9 , s(A , B) = 0.89
I ( A , B ) = 1.09 , Φ( A , B ) = 0.89 , c(A→B) = 0.98 , c(B→A) = 0.98
(c)
在反演操作下,只有Φ不变
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
(a)
6.19 : α = ( 99 × 66 ) / ( 81 × 54 ) = 1.4938
6.20 : 大学生:α = ( 1 × 30 ) / ( 4 × 9 ) = 0.8333 在职人员:α = ( 98 × 36 ) / ( 72 × 50 ) = 0.98
(b)
6.19 : Φ = ( 300 × 99 - 180 × 153 ) / ( 153 × 147 × 180 × 120 )0.5 = 0.0980
6.20 : 大学生 : Φ = ( 44 × 1 - 10 × 5 ) / ( 10 × 5 × 39 × 34 )0.5 = -0.0233
在职人员 : Φ = ( 256 × 98 - 170 × 148 ) / ( 170 × 86 × 148 × 108 )0.5 = -0.0047
(c)
6.19 : I = ( 300 × 99 ) / ( 180 × 153 ) = 1.0784
6.20 : 大学生 : I = ( 44 × 1 ) / ( 10 × 5 ) = 0.88
在职人员 : I = ( 256 × 98 ) / ( 148 × 170 ) = 0.9971

  • 92
    点赞
  • 541
    收藏
    觉得还不错? 一键收藏
  • 33
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 33
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值