关联规则挖掘的算法——Apriori算法

本文深入探讨了关联规则挖掘中的Apriori算法,它是一种经典的数据库优化技术,通过迭代生成频繁项集来发现商品之间的关联性。Apriori原理在于通过每个阶段的候选集生成和交易数据库的连接,有效地减少搜索空间。在实际工作中,Apriori算法被广泛应用于市场篮子分析,帮助商家理解消费者的购买行为。
摘要由CSDN通过智能技术生成
 
Agrawal等于1993年[1]首先提出了挖掘顾客交易数据库中项集间的关联规则问题,其核心方法是基于频集理论的递推方法。以后诸多的研究人员对关联规则的挖掘问题进行了大量的研究。他们的工作包括对原有的算法进行优化,如引入随机采样、并行的思想等,以提高算法挖掘规则的效率;提出各种变体,如泛化的关联规则、周期关联规则等,对关联规则的应用进行推广。
一、Apriori算法基本原理
Agrawal等在1993年设计了一个基本算法Apriori[4],这是一个基于两阶段频集思想的方法,将关联规则挖掘算法的设计可以分解为两个子问题:
1.         找到所有支持度大于最小支持度的项集(Itemset),这些项集称为频集(Frequent Itemset)。
2.         使用第1步找到的频集产生期望的规则。
为生成所有频繁项集,A
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值