文章目录
一、定义、解释和术语
- 翻译:先验的;推测的;自原因推及结果地。
- Apriori算法是种挖掘关联规则的频繁项集算法,一种最有影响的挖掘布尔关联规则频繁项集的算法。
- 关联分析是一种在大规模数据集中寻找有趣关系地任务。这些关系可以有两种形式:
- 频繁项集(frequent item sets):经常出现在一块地物品地集合。
- 关联规则(associational rules):暗示两种物品之间可能存在很强地关系。
- 从大规模数据集中寻找物品间地隐含关系被称作关联分析(associate analysis)或者关联规则学习(association rules learning)
- 下面用杂货铺的例子来解释这两个概念:
频繁项集:{葡萄酒,尿布,豆奶}就是一个频繁项集的例子。
关联规则:尿布 --> 葡萄酒 就是一个关联规则,意味着顾客如果买了尿布就很有可能买葡萄酒。 - 那么如何定义 频繁呢,这里我们简单介绍一下支持度和