Apriori算法

Apriori算法

一个项集的支持度:数据集中包含该项集的记录所占比例。{豆奶} {豆奶,尿布}

置信度(可信度):针对关联规则来定义的。例如 {尿布}->{葡萄酒} = 支持度{尿布,葡萄酒} /支持度{尿布}  = 0.75

           这意味着对于包含尿布的记录,规则对其中75%的记录都适用。

 

支持度,可信度是用来量化关联分析是否成功的方法。

 

频繁项集:是经常出现在一块的物品的集合

Apriori算法 就是 找频繁项集。

如果某个项集是频繁的,那么他的子集也是频繁的

如果某个项集市不频繁集,那么它的超集也是不频繁的。

关联分析目标:发现频繁项集;

                              发现关联规则。

Apriori算法:

先返回含一个元素的 数据项

          扫描找到满足最小支持度的集合,去掉不满足的集合。

在对集合进行组合,生成包含两个元素的数据项。

        

 

发现关联规则:

列出一个频繁项集的所有关联规则。

若某规则不满足最小可信度,那么,它的子集也不满足最小可信度。

(箭头左边是前件,箭头右边是后件,反过来不成立)

若0,1,2->3 不满足最小可信度

   0,1->2,3   0,2—>1,3   1,2->0,3 也不满足。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值