关联规则

最新推荐文章于 2023-01-14 16:35:54 发布

Ouchhhh

最新推荐文章于 2023-01-14 16:35:54 发布

阅读量869

点赞数

本文链接：https://blog.csdn.net/heboy22/article/details/22815701

版权

假设I是项的集合。给定一个交易数据库D，其中每个事务(Transaction)t是I的非空子集，即，每一个交易都与一个唯一的标识符TID(Transaction ID)对应。关联规则在D中的支持度(support) 是D中事务已经包含X的情况下，包含Y的百分比，即条件概率；置信度(confidence) 是D中事务同时包含X、Y的百分比，即概率。如果满足最小支持度阈值和最小置信度阈值。这些阈值是根据挖掘需要人为设定。

关联规则的简单例子

TID	网球拍	网球	运动鞋	羽毛球
1	1	1	1	0
2	1	1	0	0
3	1	0	0	0
4	1	0	1	0
5	0	1	1	1
6	1	1	0	0

用一个简单的例子说明。表1是顾客购买记录的数据库D，包含6个事务。项集I={网球拍,网球,运动鞋,羽毛球}。考虑关联规则（频繁二项集）：网球拍与网球，事务1,2,3,4,6包含网球拍，事务1,2,6同时包含网球拍和网球，X∩Y=3, D=6，支持度(X∩Y)/D=0.5；X=5, 置信度(X∩Y)/X=0.6。若给定最小支持度α = 0.5，最小置信度β = 0.6，认为购买网球拍和购买网球之间存在关联。

算法：

Apriori算法

基于划分的算法

FP-树频集算法

Ouchhhh

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
关联规则

假设I是项的集合。给定一个交易数据库D，其中每个事务(Transaction)t是I的非空子集，即，每一个交易都与一个唯一的标识符TID(TransactionID)对应。关联规则在D中的支持度(support)是D中事务已经包含X的情况下，包含Y的百分比，即条件概率；置信度(confidence)是D中事务同时包含X、Y的百分比，即概率。如果满足最小支持度阈值和最小置信度阈值。这些阈值是根据挖
复制链接

扫一扫