关联规则研究现状

本文介绍了关联规则挖掘算法的不同类型,包括多循环方式的Apriori和FP-growth算法,增量式更新的Border算法,以及并行/分布式算法如CD和PDM。此外,还提到了多层和多值关联规则挖掘,以及基于概念格的关联规则算法,展示了这一领域的丰富研究和应用。
摘要由CSDN通过智能技术生成
     自从R.Agrawal等人于1993年提出关联规则的挖掘问题后,众多的研究者对该问题进行了大量的研究,到目前为止主要的研究方向包括:多循环方式挖掘算法(层次挖掘算法)、增量式更新算法、分布、并行式挖掘算法、多层关联规则的挖掘算法、多值关联规则的挖掘算法、基于概念格的关联规则挖掘算法等。

    多循环方式挖掘算法的核心思想是“层次算法(level-wise algorithms)”,顾名思义是算法将整个挖掘过程分成若干层次,待各层次挖掘完成,再组合成最后的结果。这类算法包括Agrawal等人提出的Apriori、AIS、AprioriTid和AprioriHybrid;Park等人提出的DHP;Savadere等人提出的Partition;Toivonen提出的抽样算法Sampling;FP-growth;DIC等。其中最有效和最有影响的算法包括Apriori和FP-growth算法。

    增量式更新挖掘算法包含两种情况:1)数据库中记录发生变化(增加或删除)时的更新; D.W.Cheng等给出层次算法所对应的更新算法FUP,在此基础上,提出了FUP2算法,从而不仅可以处理交易的增加,而且还可以处理交易的删除或修改。2) 在关联规则的度量(支持度、置信度、兴趣度等)发生改变时的更新。冯玉才等对此种情况进行了研究,提出了相应的算法IUA,PIUA。Feldman提出了一种称为Border算法的关联规则更新技术。在用户指定的最低支持度为绝对数且不变的条件下,该算法只需考察所有真子集均为频繁项目集,而本身却不是频繁的项目集(这些项目集称为Border)。但是该算法仍然需要存储相关的频繁项目集结果,以减少关联规则的更新代价。

  

  • 3
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Apriori算法关联规则挖掘领域的经典算法之一,自提出以来一直受到广泛关注和研究。以下是Apriori算法研究现状的简要介绍: 1. 改进算法 由于Apriori算法需要多次扫描数据集,对大型数据集运行效率较低。因此,许多学者提出了改进算法,如FP-Growth算法、Eclat算法、PrefixSpan算法等,这些算法在运行效率和内存占用方面都有所提高。 2. 应用领域 Apriori算法的应用领域十分广泛,如市场营销、医疗健康、社交网络、网络安全等。在市场营销中,可以使用Apriori算法挖掘消费者的购物行为和偏好,提高商品销售和营销策略的精度和效率。在医疗健康中,可以使用Apriori算法分析患者的疾病和症状之间的关系,帮助医生进行诊断和治疗。在社交网络中,可以使用Apriori算法挖掘用户的兴趣和关系,改善社交网络的用户体验和服务质量。在网络安全中,可以使用Apriori算法发现恶意软件和黑客攻击的行为模式,提高网络安全的防御能力。 3. 拓展研究 除了传统的关联规则挖掘任务外,Apriori算法还被应用于其他领域的研究中,如序列模式挖掘、时间序列分析、空间数据挖掘等。此外,还有许多学者对Apriori算法进行了拓展,如基于模糊逻辑的关联规则挖掘、基于网络的关联规则挖掘等,这些研究为Apriori算法的应用和发展提供了新的思路和方向。 总的来说,Apriori算法虽然在一些方面存在缺点,但在关联规则挖掘领域仍然具有重要的研究价值和应用前景。其改进算法和拓展研究将会为更加广泛的应用场景和挖掘任务提供更加丰富和有效的解决方案。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值