【077】数据挖掘中频繁项集

本文由小婷儿撰写,重点探讨Python在数据挖掘中的应用,特别是频繁项集的概念和实践。作者分享个人学习笔记,同时也提供相关技能的培训服务,并邀请读者加入交流群共同进步。
摘要由CSDN通过智能技术生成

♣题目部分       考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含( )?
        A、1,2,3,4        B、1,2,3,5        C、1,2,4,5        D、1,3,4,5
     




♣答案部分
()
答案:C(原文见公众号:python宝)根据数据挖掘Apriori算法的性质之一:判定是否可作为K项频繁集是通过K项集分裂为K个K-1项集,考察K-1项集是否为Lk-1,要生成4-项集,{1,2,4,5}分裂后为{1,2,4}{2,4,5}{1,2,5}{1,4,5}其中,{1,4,5}不属于频繁3项集,所以{1,2,4,5}不能作为4项集,因为有性质为:任何非频繁的K-1项集都不可能是频繁项集K项集的子集。
     A、B、D你分别可以试一下,分裂后的子集是否为频繁三项集。例如:{1.2.3.4}分裂后:{1,2,4}{2,3,4}{1,3,4}{1,2,3}均满足频繁三项集里的子集。  

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值