一.关联分析概述 1.关联分析 关联分析是一种在大规模数据集中寻找有趣关系的非监督学习算法。 形式:频繁项集------经常出现在一块的物品的集合 关联规则-----暗示两种物品之间可能存在很强的关系 2.频繁项集的评估标准 2.1 支持度 2.2 置信度 2.3 提升度 3.关联规则的发现 二. Apriori算法原理 先验原理:如果一个项集是频繁的,则它的所有子集一定也是频繁的 重要:如果一个项集是非频繁项集那么他的所有超集也是非频繁的 三.使用Apriori算法来发现频繁项集