频繁关联规则:
以下面例子为例:
下面这个表格是代表一个事务数据库D,其中最小支持度为50%,最小置信度为70%,求事务数据库中的频繁关联规则。
Tid |
项目集 |
1 |
面包,牛奶,啤酒,尿布 |
2 |
面包,牛奶,啤酒 |
3 |
啤酒,尿布 |
4 |
面包,牛奶,花生 |
apriori算法的步骤如下所示:
解:
(1)设面包为A,牛奶为B,啤酒为C,尿布为D,花生为E。
即关系表示如下(该过程可不写仅表示心里所想):
Tid |
项目集 |
1 |
ABCD |
2 |
ABC |
3 |
CD |
4 |
ABE |
(2)生成候选频繁1-项目集C1={
{A},{B},{C},{D},{E} }。
扫描数据库D,可得