支持度,频繁项目集、置信度、关联规则、强关联规则、Appriori

关联规则挖掘与算法

一、支持度与频繁项目集:

(注:编辑器会根据文章标题自动生成目录) 一、事务数据库:
在这里插入图片描述

二、支持度与频繁项目集:

如表所示交易数据库,其项集 I={a,b,c,d,e},

T购买的商品
t1a,b,c,d
t2b,c,e
t3a,b,c,e
t4b,d,e
t5a,b,c,d

1、支持度:

在这里插入图片描述
在这里插入图片描述

例:{a,b}在D上的支持度为:3/5
{b,d}在D上的支持度为:3/5

2、频繁项目集

(1)频繁项目集(Frequent Itemsets):

在这里插入图片描述

还是看上面的表,假设最小支持度为0.4
D的个数为:5
计算出最小支持数:0.4x5=2

(候选频繁1-项集C1)

I-项集支持数
{a}3
{b}5
{c}4
{d}3
{e}3

(频繁1-项集L1)

I-项集支持数
{a}3
{b}5
{c}4
{d}3
{e}3

(候选频繁2-项集C2)

I-项集支持数
{a,b}3
{a,c}3
{a,d}2
{a,e}1
{b,c}4
{b,d}3
{b,e}3
{c,d}2
{c,e}2
{d,e}1

(频繁2-项集L2)

I-项集支持数
{a,b}3
{a,c}3
{a,d}2
{b,c}4
{b,d}3
{b,e}3
{c,d}2
{c,e}2

(候选频繁3-项集C3)

I-项集支持数
{a,b,c}3
{a,b,d}2
{a,b,e}1
{b,c,d}2
{b,c,e}2

(频繁3-项集L3)

I-项集支持数
{a,b,c}3
{a,b,d}2
{b,c,d}2
{b,c,e}2

(候选频繁4-项集C4)

I-项集支持数
{a,b,c,d}2
{a,b,c,e}1

(频繁4-项集L4)

I-项集支持数
{a,b,c,d}2

无(频繁4-项集L4)
综上所诉:频繁项目集为:{{a},{b},{c},{d},{e},{a,b},{a,c},{a,d},{b,c},{b,d},{b,e},{c,d},{c,e},{a,b,c},{a,b,d},{b,c,d},{b,c,e},{a,b,c,d}}

(2)最大频繁项目集(Maximum Frequent Itemsets)

频繁项目集中挑选出所有不被其它元素包含的频繁项目集

上面的频繁项目集{{a},{b},{c},{d},{e},{a,b},{a,c},{a,d},{b,c},{b,d},{b,e},{c,d},{c,e},{a,b,c},{a,b,d},{b,c,d},{b,c,e},{a,b,c,d}}
最大频繁项目集:{{b,c,e},{a,b,c,d}}。

二、置信度与关联规则

1、置信度(Confidence)又称信任度、可信度。有如下定义:

在这里插入图片描述
还是以上面那个表为例,为看时更加方便,我将上面那个表移了下来。
如表所示交易数据库,其项集 I={a,b,c,d,e},

T购买的商品
t1a,b,c,d
t2b,c,e
t3a,b,c,e
t4b,d,e
t5a,b,c,d
I1={b,c},I2={d}
含有{b,c}的有t1、t2、t3、t5.
含有{b,c,d}的有t1、t5.

在这里插入图片描述

2、强关联规则

(Strong Association Rule):

D在I中满足最小支持度和最小信任度的关联规则称为强关联规则。

(这里的满足是指大于等于)

三、 Appriori

1、Appriori属性1:如果项目集X是频繁项目集,哪么它的所有非空子集都是频繁项目集。

2、Appriori属性2:如果项目集X是非频繁项目集,那么它的所有超集都是非频繁项目集。

超集:如图S1是S2的超集。在这里插入图片描述
Apriori算法的目标是找到最大的K项频繁集

由此可生成强关联规则

首先找出:候选频繁1-项集以及支持度,根据最小支持度进行剪枝得到频繁1-项集以及支持度,链接生成候选频繁2项集。2、进行迭代直到得出最大的K项频繁集。

四、关联规则

1、关联规则生成步骤:

在这里插入图片描述

2、强关联规则

(大于等于最小支持度与置信度)
下面是最大频繁项目集{2,3,5}的强关联规则
在这里插入图片描述
下面给出两条定理:
在这里插入图片描述
在这里插入图片描述

  • 15
    点赞
  • 113
    收藏
    觉得还不错? 一键收藏
  • 5
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值