多最小支持度关联规则挖掘头项目问题证明

本文探讨了在数据挖掘中,Apriori算法的多最小支持度版本(MS-Apriori)遇到的头项目问题。通过举例说明,指出在仅依赖频繁项目集支持度计数时,某些规则的置信度可能无法计算。提出了头项目问题的定义,并利用反证法证明了当最小MIS值的项目位于规则前件时,不会出现该问题。
摘要由CSDN通过智能技术生成

在数据挖掘中,Apriori算法是一种应用十分广泛的关联规则挖掘算法。Apriori算法又分为单最小支持度算法和多最小支持度算法,实际上可以把单最小支持度算法看作是多最小支持度算法的一个特例。在实际应用中多最小支持度算法的使用频率相对较高。在不少介绍数据挖掘的书中都给出了MS-Apriori算法的比较详细的伪代码,在该算法中我们仅仅记录了每个频繁项目集的支持度计数,然而在用于生成关联规则的过程中,仅仅依靠频繁项目集的支持计数还不够。这就产生所谓的头项目问题。先给出一个简单的例子来引出这个问题:

eg:MIS(面包)=2%,MIS(衣服)=0.2%,MIS(鞋子)=0.1%。项目集{衣服,面包}真实支持度为0.15%,{衣服,鞋子,面包}真实支持度为0.12%。依据MS-Apriori算法可知{衣服,面包}不是频繁项目集,{衣服,鞋子,面包}是一个频繁项目集,所以前者的支持计数没有保存,后者的支持计数得以保存。

{衣服、面包-->鞋子}这条规则的置信度我们没法计算,同理{衣服-->鞋子、面包}、{面包-->衣服、鞋子}也可能无法计算,因为{衣服}、{面包}可能不是频繁项目集。

我们给出头项目问题(Head-Item Problem)的

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值