Apriori关联分析

已知最小支持度为60%,最小置信度为80%

1)第一步,对事务数据库进行一次扫描,计算出D中所包含的每个项目出现的次数,生成候选1-项集的集合C1。

TID

项集

T100

{A, C, S, L}

T200

{D, A, C, E, B}

T300

{A, B, C}

T400

{C, A, B, E}

C1

项集

支持度计数

{A}

4

{B}

3

{C}

4

{D}

1

{E}

2

{S}

1

{L}

1

2)第二步,根据设定的最小支持度,从C1中确定频繁1-项集L1。

L1

项集

支持度计数

{A}

4

{B}

3

{C}

4

3)第三步,由L1产生候选2-项集C2,然后扫描事务数据库对C2中的项集进行计数。

C2

项集

支持度计数

{A, B}

3

{A, C}

4

{B, C}

3

4) 第四步,根据最小支持度,从候选集C2中确定频繁2-项集L2。

L2

项集

支持度计数

{A, B}

3

{A, C}

4

{B, C}

3

5)第五步,由频繁2-项集L2生成候选3-项集C3,生成的候选3-项集的集合C3={A,B,C},C3的子集都是频繁的,且项集{A,B,C}计数为3,即L3=C3={A,B,C},L3即为频繁3-项集。

从而,所有的频繁项集为:{A},{B},{C},{A,B},{A,C},{B,C},{A,B,C}。

  

由频繁项集产生关联规则如下:

针对频繁2-项集L2,相应的置信度为:

规则

置信度

{A}->{B}

3/4=75%

{B}->{A}

3/3=100%

{A}->{C}

4/4=100%

{C}->{A}

4/4=100%

{B}->{C}

3/3=100%

{C}->{B}

3/4=75%

针对频繁3-项集L3,非空真子集有:{A},{B},{C},{A,B},{A,C},{B,C},相应的置信度为:

规则

置信度

{A}->{B,C}

3/4=75%

{B}->{A,C}

3/3=100%

{C}->{A,B}

3/4=75%

{A,B}->{C}

3/3=100%

{A,C}->{B}

3/4=75%

{B,C}->{A}

3/3=100%

因为最小置信度为90%,故所有关联规则为:

{B}->{A}、{A}->{C}、{C}->{A}、{B}->{C}、{B}->{A,C}、{A,B}->{C}、{B,C}->{A}

  • 11
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值