如何用Python挖掘“啤酒和尿布”的关系？（Apriori算法挖掘关联规则）

最新推荐文章于 2024-04-03 22:46:22 发布

Vici__

最新推荐文章于 2024-04-03 22:46:22 发布

阅读量3.2k

点赞数 9

分类专栏： private

本文链接：https://blog.csdn.net/Vici__/article/details/106108091

版权

一、什么是关联规则挖掘？

“啤酒与尿布”的故事大家都听过吧，一些年轻的父亲在去超市给孩子买尿布的时候，会顺便给自己买点啤酒，超市发现这个规律之后，就把啤酒和尿布的货架放在一起，这次改动明显增加了超市的销售额。
啤酒和尿布两者之间就存在着关联规则。
那么学会挖掘这些关联规则，用处是非常大的。

二、规则度量：支持度和置信度

支持度就是两个事务同时发生的概率。
$s u p p o r t (A, B) = P (A B)$

[注1] $P (A B)$ 就是A和B同时出现的概率。（下同）

置信度就是
$confidence(A\Rightarrow B)=P(B|A)=P(AB)/P(A)$
举个栗子：
路人甲购买了：商品A、B、C；
炮灰乙购买了：商品A、C；
流氓丙购买了：商品A、D；
土匪丁购买了：商品B、E、F。
$s u p p o r t (A, B) = P (A B) = 1 / 4 = 0.25$
$s u p p o r t (A, C) = P (A C) = 2 / 4 = 0.5$
$confidence(A\Rightarrow B)=P(B|A)=P(AB)/P(A)=1/3$