Apriori算法例题

笑哈皮

已于 2022-05-26 21:32:03 修改

阅读量2.4w

点赞数 51

分类专栏：学习笔记文章标签：数据挖掘

于 2021-11-18 21:59:33 首次发布

本文链接：https://blog.csdn.net/m0_46400910/article/details/121411304

版权

3 篇文章

订阅专栏

Apriori算法

表1

最小支持度为40%，最小信任度为60%

首先找出频繁项目集L1,然后找出频繁项目集L2，直到不能再扩展频繁项目集的元素数目而算法停止。

最小支持数为40%*5（5是TID个数）=2

L	C
ABCD	2
BCDE	0

挑出支持数(表5中C)>=2的项目集组成频繁项目集L4={ABCD}

由L4生成5-候选表C5=∅，L5=∅，算法停止

则所有频繁项目集为{A,B,C,D,E,AB,AC,AD,BC,BD,BE,CD,CE,ABC,ABD,ACD,BCD,BCE,ABCD}

补充超集

超集：若一个集合S2中的每一个元素都在集合S1中，且集合S1中可能包含S2中没有的元素，则集合S1 就是S2 的一个超集。S1是S2的超集，则S2 是S1的真子集，反之亦然。

最大项目集：最大频繁项集是各频繁k项集中符合无超集条件的频繁项集。

比如：

{A}的超集为{AB,AC,AD,AE,ABC,ABD,ABE,ACD,ACE,ABCD,ABCDE}

{ABC}的超集为{ABCD,ABCDE}

所以最大频繁项目集为{ABCD,BCE}

自信度大于等于最小信任度为60%为强关联

求各自信度：条件=>结果，自信度=结果在表1出现的次数/条件在表1出现的次数

比如下表，序号1，ABC=>ABCD,自信度=ABCD在表1出现的次数/ABC在表1出现的次数=2/3=67%

序号	结果	条件	自信度	是否为强关联
1	ABCD	ABC	67%	是
2	ABCD	AB	67%	是
3	ABCD	A	67%	是
4	ABCD	B	40%	否
5	ABCD	AC	67%	是
6	ABCD	C	50%	否
7	ABCD	BC	50%	否
8	ABCD	ABD	100%	是
9	ABCD	AD	100%	是
10	ABCD	D	67%	是
11	ABCD	BD	67%	是
12	ABCD	ACD	100%	是
13	ABCD	CD	100%	是
14	ABCD	BCD	100%	是
15	BCE	BC	50%	否
16	BCE	B	40%	否
17	BCE	C	50%	否
18	BCE	BE	67%	是
19	BCE	E	67%	是
20	BCE	CE	100%	是