数据挖掘之Aprior算法

关联规则Aprior算法,我看过很多书,但是都没有看太明白,今天看到一本讲数据挖掘的书《数据挖掘:概念、模型、方法和算法》,里面讲的特别清楚,每一步都特别详细,故把它记录下来。首先看一个表,这个表时一个简单事务数据库的模型

表1
TID
001A C D
002B C E
003A B C E
004B E

假定最小支持度s = 50%,所以。只有在至少50%的事务中都出现的项集才是频繁项集。

在第一次迭代的第一步中,所有单个项都作为候选集,它的生成阶段,计数阶段和选择阶段如下:

(a1)生成阶段
1-项集C_1
{A}
{C}
{D}
{B}
{E}

(b1)计数阶段
          1-项集计数s[%]
{A}250
{C}375
{D}125
{B}375
{E}375
(c1)选择阶段
 
大1-项集L-1计数s[%]
{A}250
{C}375
   
{B}375
{E}375

在第二次迭代中, 它的生成阶段由(c1)选择阶段中的项集两两构成,计数阶段和选择阶段如下:

(a2)生成阶段
                    12-项集C_2
{A, B}
{A,C}
{A,E}
{B,C}
{B,E}
{C,E}

(b2)计数阶段
2-项集计数s[%]
{A, B}125
{A,C}250
{A,E}125
{B,C}250
{B,E}375
{C,E}250

(c2)选择阶段
 
大2-项集L_2计数s[%]
   
{A,C}250
   
{B,C}250
{B,E}375
{C,E}250

在第3次迭代中, 它的生成阶段由(c2)选择阶段中的项集两两构成,计数阶段和选择阶段如下:

(a3)生成阶段
                    3-项集C_3
{B, C, E}

(b3)计数阶段
3-项集计数s[%]
{B, C, E }250

(c3)选择阶段
大3-项集L_3计数s[%]
{B, C,E}250

在例子中,L_3无法产生候选的4-项集,所以Apriori算法停止迭代过程。

以上为经典的Apriori算法的例子。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值