Topological simplicial analysis (拓扑单纯分析)& Association Rule Mining-based 关联准则

最新推荐文章于 2024-09-15 01:19:00 发布

豆包在奔跑

最新推荐文章于 2024-09-15 01:19:00 发布

阅读量198

点赞数

文章标签：大数据

本文链接：https://blog.csdn.net/m0_51635708/article/details/127242541

版权

关联规则学习（英语：Association rule learning）是一种在大型数据库中发现变量之间的有趣性关系的方法

表1：关联规则的简单例子
TID	网球拍	网球	运动鞋	羽毛球
1	1	1	1	0
2	1	1	0	0
3	1	0	0	0
4	1	0	1	0
5	0	1	1	1
6	1	1	0	0

一般我们使用三个指标来度量一个关联规则，这三个指标分别是：支持度、置信度和提升度。

Support（支持度）：表示某个项集出现的频率，也就是包含该项集的交易数与总交易数的比例。例如P(A)表示项集A的比例， $P(A\cap B)$ 表示项集A和项集B同时出现的比例。
Confidence（置信度）：表示当A项出现时B项同时出现的频率，记作{A→B}。换言之，置信度指同时包含A项和B项的交易数与包含A项的交易数之比。公式表达：{A→B}的置信度= $P(B\mid A)=P(A\cap B)/P(A)$ 。
Lift（提升度）：指A项和B项一同出现的频率，但同时要考虑这两项各自出现的频率。公式表达：{A→B}的提升度={A→B}的置信度/P(B)= $P(B\mid A)/P(B)= P(A\cap B)/(P(A)*P(B))$ 。
提升度反映了关联规则中的A与B的相关性，提升度>1且越高表明正相关性越高，提升度<1且越低表明负相关性越高，提升度=1表明没有相关性。负值，商品之间具有相互排斥的作用。