Apriori算法中频繁项目集生成算法C语言实现

数据挖掘是从大量数据中分析推断出数据规律的一种技术,它具有广泛的应用前景,比如社交网络中好友推荐,购物网站中的商品推荐等等。数据挖掘至提出到现在,已经产生了多种数据挖掘算法。其中Apriori 是一种最有影响的挖掘布尔关联规则频繁项集的算法。本文使用C语言实现来一个单一最小支持度的Apriori算法。         行文开始之前先简单介绍一下相关概念。设I={i1,i2,i3……im}是一个
摘要由CSDN通过智能技术生成

          数据挖掘是从大量数据中分析推断出数据规律的一种技术,它具有广泛的应用前景,比如社交网络中好友推荐,购物网站中的商品推荐等等。数据挖掘至提出到现在,已经产生了多种数据挖掘算法。其中Apriori 是一种最有影响的挖掘布尔关联规则频繁项集的算法。本文使用C语言实现来一个单一最小支持度的Apriori算法。

         行文开始之前先简单介绍一下相关概念。设I={i1,i2,i3……im}是一个项目(Item)集合T={t1,t2,……,tm}是一个事物集合,每个事物t是一个项目集合,且t属于I,一条关联规则定义如下:X->Y,其中X、Y都属于I且X与Y的交集是空集。集合T中所有包含X的事物的数目称之为X的支持计数(X.count),一个规则的支持度:sup=(XUY.count)/n,n是T中事物的个数。置信度:conf=(XUY.count)/X.count。支持度决定了规则在T中出现的频度,置信度指出了规则的可预测度。minsup与minconf是用户指定的满足条件的一个最小阀值。一个频繁项目集是指一个支持度高于minsup的项集。如何高效的从中找到满足条件的规则,是数据挖掘中一个基础问题。如果从I中找出所有可能的规则,然后再从规则中去找,这会随着I的基数增加而成指数规模增加,显然不具有使用的价值。Apriori算法通过一定的剪枝优化策略使得计算大大缩小。

         Apriori算法大致分为两步:1生成所有的频繁项目集,2从频繁项目集中生成所有的可信关联规则(指它的置信度高于minconf)。Apriori算法基于演绎原理生成所有的频繁项目集:如歌一个频繁项目集满足最小支持度要求,那么它的所有非空子集都满足最小支持度要求。位了简化

  • 7
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值