aprioir算法_一句话+一张图——说清楚Aprioir关联规则算法

weixin_39676930

于 2020-12-22 12:12:45 发布

阅读量236

点赞数

文章标签： aprioir算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39676930/article/details/111845517

版权

原标题：一句话+一张图——说清楚Aprioir关联规则算法

一句话

关联分析(关联规则学习): 从大规模数据集中寻找物品间的隐含关系被称作关联分析(associati analysis) 或者关联规则学习(association rule learning)

一张图

解释一下这张图：

在关联规则Aprioir算法中，有两个很重要的概念，分别是频繁项集(frequent item sets)，关联规则(associational rules)，它们是用来描述隐含关系的形式。

频繁项集(frequent item sets): 经常出现在一块的物品的集合。

关联规则(associational rules): 暗示两种物品之间可能存在很强的关系。

那么频繁的定义是什么呢？怎么样才算频繁呢？度量它们的方法有很多种，这里我们来简单的介绍下支持度和可信度。

支持度: 数据集中包含该项集的记录所占的比例。例如上图中，{豆奶} 的支持度为 4/5。{豆奶, 尿布} 的支持度为 3/5。

可信度: 针对一条诸如 {尿布} -> {葡萄酒} 这样具体的关联规则来定义的。这条规则的可信度被定义为支持度({尿布, 葡萄酒})/支持度({尿布})，从图中可以看出支持度({尿布, 葡萄酒}) = 3/5，支持度({尿布}) = 4/5，所以 {尿布} -> {葡萄酒} 的可信度 = 3/5 / 4/5 = 3/4 = 0.75。

举个栗子呗

还是上面的那个尿布和葡萄酒的栗子，让我们仔细的看一下它的关联规则的发现过程(Aprioir)

过程1：寻找k项频繁集

我们规定最小支持度为0.3

L1为1项频繁集，可以从图中看出它的计算过程为：

P(豆奶)=豆奶出现的次数订单总数量P(豆奶)=豆奶出现的次数订单总数量

L2为2项频繁集，从L1中选择候选者(去除了小于最小支持度的数据)，计算过程为：

P(豆奶，莴苣)=豆奶，莴苣共同出现的次数订单总数量P(豆奶，莴苣)=豆奶，莴苣共同出现的次数订单总数量

同理可以推出L3

过程2：发现关联规则

这里举一个例子说明，买了尿布的人也会继续买葡萄酒的规则，支持度为0.6(前面已经算出)，那么它的置信度计算过程为：

P(尿布−−>葡萄酒)=尿布，葡萄酒同时出现的概率尿布出现的概率=P(葡萄酒|尿布)P(尿布−−>葡萄酒)=尿布，葡萄酒同时出现的概率尿布出现的概率=P(葡萄酒|尿布)

以上就是Aprioir关联规则算法的整体思路啦！！！返回搜狐，查看更多

责任编辑：

weixin_39676930

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
aprioir算法_一句话+一张图——说清楚Aprioir关联规则算法

原标题：一句话+一张图——说清楚Aprioir关联规则算法一句话关联分析(关联规则学习): 从大规模数据集中寻找物品间的隐含关系被称作关联分析(associati analysis) 或者关联规则学习(association rule learning)一张图解释一下这张图：在关联规则Aprioir算法中，有两个很重要的概念，分别是频繁项集(frequent item sets)，关联规则...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。