关联规则研究现状

本文介绍了关联规则挖掘算法的不同类型,包括多循环方式的Apriori和FP-growth算法,增量式更新的Border算法,以及并行/分布式算法如CD和PDM。此外,还提到了多层和多值关联规则挖掘,以及基于概念格的关联规则算法,展示了这一领域的丰富研究和应用。
摘要由CSDN通过智能技术生成
     自从R.Agrawal等人于1993年提出关联规则的挖掘问题后,众多的研究者对该问题进行了大量的研究,到目前为止主要的研究方向包括:多循环方式挖掘算法(层次挖掘算法)、增量式更新算法、分布、并行式挖掘算法、多层关联规则的挖掘算法、多值关联规则的挖掘算法、基于概念格的关联规则挖掘算法等。

    多循环方式挖掘算法的核心思想是“层次算法(level-wise algorithms)”,顾名思义是算法将整个挖掘过程分成若干层次,待各层次挖掘完成,再组合成最后的结果。这类算法包括Agrawal等人提出的Apriori、AIS、AprioriTid和AprioriHybrid;Park等人提出的DHP;Savadere等人提出的Partition;Toivonen提出的抽样算法Sampling;FP-growth;DIC等。其中最有效和最有影响的算法包括Apriori和FP-growth算法。

    增量式更新挖掘算法包含两种情况:1)数据库中记录发生变化(增加或删除)时的更新; D.W.Cheng等给出层次算法所对应的更新算法FUP,在此基础上,提出了FUP2算法,从而不仅可以处理交易的增加,而且还可以处理交易的删除或修改。2) 在关联规则的度量(支持度、置信度、兴趣度等)发生改变时的更新。冯玉才等对此种情况进行了研究,提出了相应的算法IUA,PIUA。Feldman提出了一种称为Border算法的关联规则更新技术。在用户指定的最低支持度为绝对数且不变的条件下,该算法只需考察所有真子集均为频繁项目集,而本身却不是频繁的项目集(这些项目集称为Border)。但是该算法仍然需要存储相关的频繁项目集结果,以减少关联规则的更新代价。

  

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值