Aprior 算法

Apriori 算法:(hadoop中实现)


                 

第一步:统计项的频度 (用一个MR统计出来)

                   

假设是一个矩阵


U1     app1 ,  app3

U2     app1 ,  app2  ,  app3

U3     app2 ,  app3    


把矩阵看成一行行的向量

U1<app1 ,  app3>

U2<app1 ,  app2  ,  app3>

U3<app2 ,  app3>

装置矩阵

<app1,U1><app3,U1>

<app1,U2><app2,U2><app3,U2>

<app2,U3><app3,U3>


key:app  vaule:U

放到Reduce统计

如: app1 ,<U1,U2> 输出==>app1:2 app2:3 app3:2

              

第二步:根据最小支持度进行筛选  假设最小支持度是3

                     

第三步:根据上面的表生成候选集

                     

第四步:对每个候选对在矩阵的每一行去比较(数据库)看看它的频度

                    

第五步:对比最小支持度筛选出来

                   

第六步:继续生成3项频繁集

利用MR生成(本人构思 不推荐)

 cd:5 ce:3 ==> c:1 d:1 c:1 e:1 ==> c:2 d:1 e:1 ==>1:c 1:d 1:e==>1:<c,d,e>

对value生成3项

                  

第七步:继续往下直到没有(K+1)频繁项






想法1:从k=1找频繁集直到到达目标k 
想法2:从所有项集中找出所有的包含k个元素的子集,统计支持度和置信度(更好和容易实现


  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值