频繁模式(frequent pattern)

最新推荐文章于 2024-04-07 10:40:38 发布

Datawhale

最新推荐文章于 2024-04-07 10:40:38 发布

阅读量8.3k

点赞数 3

分类专栏：算法工程师面经算法工程师面经

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Datawhale/article/details/91898617

版权

Datawhale

频繁模式(frequent pattern)

频繁模式一般是指频繁地出现在数据集中的模式。这种频繁模式和关联规则是数据挖掘中想要挖掘的知识。

我们都知道一个很有趣的故事，就是啤酒和尿布的故事，在某些特定的情况下，“啤酒”与“尿布”两件看上去毫无关系的商品，会经常出现在同一个购物篮中，且大多出现在年轻的父亲身上。

分析背后原因是，在美国有婴儿的家庭中，一般是母亲在家中照看婴儿，年轻的父亲去超市买尿布。父亲在购买尿布的同时，往往会顺便为自己购买啤酒。

由此，沃尔玛就在卖场尝试将啤酒与尿布摆放在相同区域，让年轻的父亲可以同时找到这两件商品，并很快地完成购物，从而极大提升商品销售收入。

数据挖掘就是想要挖掘出这种有趣的模式，可以称做频繁模式和关联规则的挖掘，一般情况下使用支持度(support)和置信度(confidence)来表示关联的程度，领域的专家设置最小支持度和最小置信度阈值，如果某个模式大于最小支持度和最小置信度，就认为是频繁模式。

一般常用的有两种算法:

Apriori
Fp-tree

在介绍这两个算法之前需要给出一些定义:

A=>B的支持度:
$support(A=>B)=p(A\cup B) \tag{1}$
A=>B的置信度:
$=\frac{support(A \cup B)}{supoort(A)}=\frac{support_count(A \cup B)}{supoort_count(A)} \tag{2}$

最低0.47元/天解锁文章

关注

3
点赞
踩
34

收藏

觉得还不错? 一键收藏
0
评论
频繁模式(frequent pattern)

Datawhale频繁模式(frequent pattern)频繁模式一般是指频繁地出现在数据集中的模式。这种频繁模式和关联规则是数据挖掘中想要挖掘的知识。我们都知道一个很有趣的故事，就是啤酒和尿布的故事，在某些特定的情况下，“啤酒”与“尿布”两件看上去毫无关系的商品，会经常出现在同一个购物篮中，且大多出现在年轻的父亲身上。分析背后原因是，在美国有婴儿的家庭中，一般是母亲在家中照看...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。