Apriori关联规则算法整个思路

1.设定最小支持度和置信度,支持度确定规则可以用于给定数据集的频繁程度,置信度确定YY在包含XX的交易中出现的频繁程度。

support是支持度,confidence是置信度。

2.通过读取获取的数据:去除重复元素,得到所有的基本元素如(A、B、C、D、E)称为1项候选集C1,并且算出来每个项的支持度。

3.在C1候选集中通过设定的最小支持度去除非频繁项(非频繁项与其他项组合也是非频繁项)得到1项频繁集L1

4.开始循环执行,通过频繁项组合得到K项候选集Ck,组合的时候需要满足规则,组合成的项拆分出来的所有k-1子集都可以在上一层中存在如ACD拆成AC、AD、CD都存在于上一层。通过剔除Ck候选集中的非频繁项得到Lk频繁集。直到没有满足的最小支持度的项为止。

5.当得到所有的频繁集之后(2项频繁集、3项频繁集、……),算所有的置信度。

这就是在买a的时候会买b的概率,买c,e的时候会买a的概率。

 

转载java实现Apriori源码:https://github.com/muziyongshixin/Association-rule-mining-with-Apriori

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值