数据挖掘中,Apriori算法讲解

一般给定一个事务数据库,关联规则挖掘问题就是通过用户指定最小支持度(support)和最小可信度(confidence)来寻找强关联规则的过程。关联规则挖掘问题可以划分成两个子问题,第一,发现频繁项目集,第二,生成关联规则。

一,我讲的这部分是频繁项集的生成,之后还有生成关联规则的部分。Apriori算法是一种关联规则的频繁项算法。
二,它的核心思想是使用候选项集寻找频繁项集。Aprori算法使用一种称为逐层搜索的迭代方法,k-项集用于搜索(k+1)-项集。首先找出所有频繁1-项集L1,然后用L1寻找频繁2-项集L2,然后用L2寻找频繁3-项集L3,以此类推下去,直到不能找到频繁K-项集为终止。
三,Apriori算法的用途
可以用于消费市场价格分析,猜测顾客的消费习惯。

下面,我们可以来看一个关于Aprori算法的例子

TID Itemset
1 A,B,C,D
2 B,C,E
3 A,B,C,E
4 B,D,E
5 A,B,C,D

其中minsup_count>=2

第一步:生成候选集并通过扫描数据库得到它们的支持数,C1={(A,3),(B,5),(C,4),(D,3)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值