Apriori算法中候选项集、频繁项集的产生

本文详细介绍了如何通过自连接操作生成候选项集,并利用先验知识进行剪枝,确保候选集中的子集均为频繁的。这种方法在数据挖掘中用于高效找出频繁项集,首先生成包含潜在频繁项的候选项集,然后通过剪枝减少计算量,最后筛选出最小支持度的频繁项集。
摘要由CSDN通过智能技术生成

候选项集的产生通过自连接和剪枝操作产生
在这里插入图片描述

如何通过自连接产生剪枝之前的候选k-项集方法参见https://blog.csdn.net/jerk_lee/article/details/45670809
通过先验性质判断候选集中的子集是否都是频繁的,如果存在一个不是频繁的则进行剪枝操作,这样产生的候选集中的子集都是频繁的,但此时候选集不是频繁项集,然后再从该候选集中选择具有最小支持度的项集构成在这项里插入图片描述频繁项集
候选项集中的非空子集都是频繁的,但该候选项集不一定是频繁项集。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值