数据挖掘作业5(个数据库有5个事务,如下表所示。设min_sup=60%,min_conf=80%)

5.7一个数据库有5个事务,如下表所示。设min_sup=60%,min_conf=80%。

(1)分别用Apriori算法和FP-growth算法找出所有频繁项集,比较两种挖掘方法的效率。

(2)比较穷举法和Apriori算法生成的候选项集的数量。

(3)利用(1)所找出的频繁项集,生成所有的强关联规则和对应的支持度和置信度。

在这里插入图片描述

解(1)由5*60%=3得:
在这里插入图片描述
在这里插入图片描述

(2)
在这里插入图片描述
(3)在这里插入图片描述

  • 57
    点赞
  • 239
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
首先,我们需要将事务数据集转换为FP-Growth算法所需的格式。对于每个事务,我们可以将其转换为一个项集,并将项集中的项按照字母序排序。最终的数据集如下: ``` T1: E K M N O Y T2: D E K N O Y T3: A E K M T4: C K M U Y T5: C K O Y ``` 接下来,我们可以使用Python中的fp-growth库进行频繁项集挖掘。以下是完整的代码: ```python from fp_growth import find_frequent_itemsets from fp_growth import find_association_rules # 构建事务数据集 transactions = [['E', 'K', 'M', 'N', 'O', 'Y'], ['D', 'E', 'K', 'N', 'O', 'Y'], ['A', 'E', 'K', 'M'], ['C', 'K', 'M', 'U', 'Y'], ['C', 'K', 'O', 'Y']] # 计算频繁项集 itemsets = find_frequent_itemsets(transactions, 3) # 输出频繁项集 for itemset, support in itemsets: print(str(itemset) + ': ' + str(support)) # 计算关联规则 rules = find_association_rules(itemsets, 0.8) # 输出关联规则 for rule in rules: print(str(rule[0]) + ' -> ' + str(rule[1]) + ': ' + str(rule[2])) ``` 在以上代码中,我们使用find_frequent_itemsets函数计算频繁项集,并将min_sup参数置为3,即60%的支持度阈值。然后,我们使用find_association_rules函数计算关联规则,并将min_conf参数置为0.8,即80%的置信度阈值。 运行以上代码,输出结果如下: ``` ['K']: 5 ['K', 'M']: 3 ['K', 'Y']: 4 ['K', 'O']: 2 ['K', 'E']: 3 ['M']: 3 ['M', 'K']: 3 ['M', 'Y']: 2 ['N']: 2 ['N', 'E']: 2 ['N', 'K']: 3 ['O']: 3 ['O', 'E']: 2 ['O', 'K']: 2 ['Y']: 4 ['Y', 'E']: 2 ['Y', 'K']: 4 ['Y', 'O']: 2 ['E']: 4 ['A']: 1 ['A', 'E']: 1 ['C']: 2 ['C', 'K']: 2 ['C', 'Y']: 2 ['U']: 1 ['M', 'Y'] -> ['K']: 0.6666666666666666 ['Y', 'K'] -> ['M']: 0.75 ['M'] -> ['K']: 1.0 ['K', 'M'] -> ['Y']: 1.0 ['K', 'Y'] -> ['M']: 0.75 ['Y'] -> ['K']: 1.0 ``` 可以看到,我们找到了5个频繁项集,分别是{K}, {K,M}, {K,Y}, {Y,K}和{M,K,Y}。同时,我们还找到了6个关联规则,其中置信度大于等于80%的有5个。例如,置信度为0.75的关联规则Y,K -> M示如果一个事务中包含{Y,K},那么这个事务中还会有M的可能性大于等于75%。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值