Apriori算法的解释和实现

频繁项集与关联规则

频繁项集:意思是经常会出现在一起的物品的集合。

关联规则:是两个物品之间可能存在很强的关联关系。

支持度:即用集合当中所有元素一起出现的次数,除以所有的数据条数

置信度:对于一个关联规则而言,它指的是A物品和B物品之间的内在关系,其实也就是条件概率。所以A->B关联规则的概率就是P(AB)/P(A)和条件概率的公式一样.

确信度

 

提升度

 

 

Apriori算法实现

'''首先先安装efficient_apriori模块'''
from efficient_apriori import apriori

# 设置数据集合
data = [[1, 3, 4], [2, 3, 5], [1, 2, 3, 5], [2, 5]]

# 挖掘数据频繁集项和规则
itemsets, rules = apriori(data, min_support=0.4, min_confidence=1)
print(itemsets)
print(rules)  

输出结果:

 

 

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值