数据挖掘十大经典算法(4) The Apriori algorithm

最新推荐文章于 2024-06-28 00:19:05 发布

莫等闲

最新推荐文章于 2024-06-28 00:19:05 发布

阅读量3w

点赞数 3

分类专栏：名词解释文章标签：算法 algorithm 数据挖掘数据库

名词解释专栏收录该内容

10 篇文章 1 订阅

订阅专栏

Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。其核心是基于两阶段频集思想的递推算法。该关联规则在分类上属于单维、单层、布尔关联规则。在这里，所有支持度大于最小支持度的项集称为频繁项集，简称频集。

Apriori演算法所使用的前置统计量包括了：

最大规则物件数：规则中物件组所包含的最大物件数量
最小支援：规则中物件或是物件组必顸符合的最低案例数
最小信心水准：计算规则所必须符合的最低信心水准门槛

　　该算法的基本思想是：首先找出所有的频集，这些项集出现的频繁性至少和预定义的最小支持度一样。然后由频集产生强关联规则，这些规则必须满足最小支持度和最小可信度。然后使用第1步找到的频集产生期望的规则，产生只包含集合的项的所有规则，其中每一条规则的右部只有一项，这里采用的是中规则的定义。一旦这些规则被生成，那么只有那些大于用户给定的最小可信度的规则才被留下来。为了生成所有频集，使用了递推的方法。
　　可能产生大量的候选集,以及可能需要重复扫描数据库，是Apriori算法的两大缺点。

关注

3
点赞
踩
30

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。