频繁模式和关联规则原理与简述

最新推荐文章于 2024-06-20 10:15:16 发布

傲慢灬

最新推荐文章于 2024-06-20 10:15:16 发布

阅读量6k

点赞数 5

分类专栏：数据挖掘数据挖掘基础算法文章标签：频繁模式关联规则频繁闭项集最大频繁项集数据挖掘

本文链接：https://blog.csdn.net/jerry81333/article/details/52803834

版权

本文深入探讨了数据挖掘中的频繁模式和关联规则，从“啤酒与尿布”的经典案例出发，介绍了项集、K-项集、支持度、置信度等核心概念，并讨论了频繁闭项集和最大频繁项集在压缩数据和提高效率方面的作用。同时，文章还提到了用于挖掘这些模式的算法。

摘要由CSDN通过智能技术生成

频繁模式和关联规则：

“啤酒与尿布”故事：

这是一个几乎被举烂的例子，“啤酒与尿布”的故事产生于20世纪90年代的美国沃尔玛超市中，沃尔玛的超市管理人员分析销售数据时发现了一个令人难于理解的现象：在某些特定的情况下，“啤酒”与“尿布”两件看上去毫无关系的商品会经常出现在同一个购物篮中，这种独特的销售现象引起了管理人员的注意，经过后续调查发现，这种现象出现在年轻的父亲身上。

在美国有婴儿的家庭中，一般是母亲在家中照看婴儿，年轻的父亲前去超市购买尿布。父亲在购买尿布的同时，往往会顺便为自己购买啤酒，这样就会出现啤酒与尿布这两件看上去不相干的商品经常会出现在同一个购物篮的现象。如果这个年轻的父亲在卖场只能买到两件商品之一，则他很有可能会放弃购物而到另一家商店，直到可以一次同时买到啤酒与尿布为止。沃尔玛发现了这一独特的现象，开始在卖场尝试将啤酒与尿布摆放在相同的区域，让年轻的父亲可以同时找到这两件商品，并很快地完成购物；而沃尔玛超市也可以让这些客户一次购买两件商品、而不是一件，从而获得了很好的商品销售收入，这就是“啤酒与尿布”故事的由来。

当然“啤酒与尿布”的故事必须具有技术方面的支持。1993年美国学者Agrawal 提出通过分析购物篮中的商品集合，从而找出商品之间关联关系的关联算法，并根据商品之间的关系，找出客户的购买行为。艾格拉沃从数学及计算机算法角度提出了商品关联关系的计算方法——A prior算法。沃尔玛从上个世纪90年代尝试将Aprior算法引入到POS机数据分析中，并获得了成功，于是产生了“啤酒与尿布”的故事。