Apriori算法 (Introduction to data mining)

Apriori算法是一种经典的数据挖掘方法,用于关联规则挖掘。算法通过支持度和置信度来评估项集的频繁程度和规则的可信度。首先,遍历数据集获取频繁1-项集,然后迭代生成并检测更高阶的频繁项集。如果一个项集频繁,其所有子集也频繁。在规则生成阶段,若规则不满足置信度阈值,则其所有子规则也不满足。Apriori算法简单易懂,但可能产生大量候选项集,导致I/O负载大。
摘要由CSDN通过智能技术生成

前置概念:

Support: 支持度 s(X->Y) =(XUY)/N;

Confidence: 置信度 c(X->Y) =(XUY)/(X);

Frequent ItemSet: 频繁项集 Support >minSup;

 

Apriori Principle: 如果一个项集是频繁的,那它所有的子项集也都是频繁的。

 

Frequent Itemset Generation in the AprioriAlgorithm:

Apriori算法是第一个指出使用基于支持度剪枝策略的关联规则挖掘算法,系统地控制候选项集的指数增长。

Ck代表k候选项集, Fk代表频繁k项集

1 算法首先遍历一遍数据集,检测每项的支持度,获取频繁1-项集。Steps (1-2)

2 接下来,循环使用频繁(k-1)-项集派生k-候选项集。Step (5)

3 遍历数据集计算候选项集支持度Steps (6-10)

4 计算支持度后,消除非频繁项集Step (12)

5 当没有新的频繁项集产生的时候,算法结束Step(13)

Frequent itemset generation of the AprioriAlgorithm.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值