数据挖掘导论:从包含d个项的数据集提取的可能规则总数

本文分享了从包含d个项的数据集中提取关联规则总数的公式R=3d−2d+1+1的证明过程,涉及排列组合知识。通过逐步分析不同项数k的规则数量并求和,最终得出结论。
摘要由CSDN通过智能技术生成

在数据挖掘导论(完整版)一书中的第6章讲到了关联分析,并在6.1问题定义中提到了关联规则。
其中第203页中直接给出了公式(6-3):从包含d个项的数据集提取的可能规则总数为 R=3d2d+1+1 ,并要求自己证明,同时也是第251页的习题5。

该公式的证明过程用到了排列组合的知识,现在把我的证明过程和大家分享一下。

证明:
对于关联规则 X→Y ( 其中X∩Y= ),X∪Y包含的项的个数可以为2,3,…,d。
假设X∪Y包含的项的个数为k,则计算此情况下可能规则数,须先从d个项中抽取k个项,即 Ckd ;再对选出的k个项选取m(m=1,2,3,…,k-1)个项作为规则的左部X,剩余k-m个项作为规则的右部Y,选法的种类数共有 C1k+C2k+C3k++Ck1k ,即 k1m=1Cmk

下面来求 k1m=1Cmk 的值。首先我们知道 km=0Cmk=(1+1)k=2k

k1m=1Cmk=

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值