数据挖掘Apriori算法

Apriori算法是一种经典的数据挖掘算法,主要用于频繁项集挖掘和关联规则学习。通过Apriori原则减少候选项的数目,利用剪枝策略优化计算。文章详细介绍了Apriori的步骤,包括候选项目集生成、支持度计算、哈希树在减少比较次数中的应用,以及Apriori的缺点和改进方法,如事务压缩和基于哈希表的项集计数等。
摘要由CSDN通过智能技术生成

定义:

Apriori 是一种用于频繁项集挖掘和关联规则学习交易数据库的算法。它通过识别数据库中的频繁个体项目,并将其扩展到更大和更大的项目集,只要这些项目集在数据库中出现得足够多。由Apriori确定的频繁项目集可用于确定突出数据库中总体趋势的关联规则:这在诸如市场篮子分析等领域中有应用。维基百科

减少候选项的数目

Apriori principle

如果一个项目集市频繁的,那么它的所有子项目集一定是频繁的。
Apriori原则由以下支持度关系维持:

X,Y:(XY)s(X)s(Y)</
  • 3
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值