机器学习实战学习笔记10——Apriori算法

1.Apriori概述


1.1 Apriori介绍


Apriori算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集。该算法已经被广泛的应用到消费市场价格分析,入侵检测、电商购物推荐等领域。

1.2 Apriori原理


关联分析是一种在大规模数据集中寻找频繁项集和关联规则的任务。该算法的基本思想是:
(1)首先找出所有的频集,这些项集出现的频繁性至少和预定义的最小支持度一样。
(2)然后由频繁项集产生强关联规则,这些规则必须满足最小支持度和最小可信度。
(3)使用步骤(1)中找到的频繁项集产生期望的规则,产生只包含集合的项的所有规则。一旦这些规则被生成,那么只有那些大于用户给定的最小可信度的规则才被留下来。

1.3 Apriori优缺点


(1)优点:简单、易理解、数据要求低
(2)缺点:I/O负载较大、候选项集过多
(3)应用领域:消费市场价格分析,入侵检测、电商购物推荐

2.使用Apriori算法发现频繁项集


3.从频繁项集中挖掘关联规则


4.Apriori案例:发现国会投票中的模式


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值