Apriori算法学习（一）

最新推荐文章于 2023-01-18 17:07:43 发布

驽马56

最新推荐文章于 2023-01-18 17:07:43 发布

阅读量927

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/rrdtools/article/details/8880634

版权

Apriori核心算法过程如下：

扫描数据集合计算出各个1项集的支持度，得到频繁1项集的集合。
连接，由2个只有一个项不同的属于的频集做一个（k-2）JOIN运算得到的。
剪枝，由于是的超集，所以可能有些元素不是频繁的。在潜在k项集的某个子集不是中的成员是，则该潜在频繁项集不可能是频繁的可以从中移去。
通过单趟扫描数据集合，计算中各个项集的支持度，将中不满足支持度的项集去掉形成。

　　通过迭代循环，重复步骤2～4，直到有某个r值使得为空，这时算法停止。在剪枝步中的每个元素需在交易数据库中进行验证来决定其是否加入，这里的验证过程是算法性能的一个瓶颈。这个方法要求多次扫描可能很大的交易数据库。可能产生大量的候选集，以及可能需要重复扫描数据库，是Apriori算法的两大缺点。

　　目前，几乎所有高效的发现关联规则的并行数据挖掘算法都是基于Apriori算法的，Agrawal和Shafer 提出了三种并行算法：计数分发（Count Distribution）算法、数据分发（Data Distribution）算法和候选分发（Candidate Distribute）算法。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Apriori算法学习（一）

Apriori核心算法过程如下：扫描数据集合计算出各个1项集的支持度，得到频繁1项集的集合。连接，由2个只有一个项不同的属于的频集做一个（k-2）JOIN运算得到的。剪枝，由于是的超集，所以可能有些元素不是频繁的。在潜在k项集的某个子集不是中的成员是，则该潜在频繁项集不可能是频繁的可以从中移去。通过单趟扫描数据集合，计算中各个项集的支持度，将中不满足支持度的项集去掉形成。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。