机器学习中常用关联规则算法
关联规则算法是一种基于规则的机器学习算法,该算法可以在大数据中发现彼此之间的关系。
它的目的是:利用一些度量指标来分辨数据库中存在的强规则。也即是说关联规则挖掘是用于知识发现,而非预测,所以是属于无监督的机器学习方法。
算法名称 | 算法描述 |
---|---|
Apriori | 关联规则最常用也是最经典的挖掘频繁项集的算法 其核心思想是通过连接产生候选项及其支持度然后通过剪枝生成频繁项集 |
FP-Tree | 针对Apriori算法的固有的多次扫描事务数据集的缺陷,提出的不产生候选频繁项集的方法。 Apriori 和 FP-Tree 都是寻找频繁项集的算法 |
Eclat算法 | Eclat算法是一种深度优先算法,采用垂直数据表示形式,在概念理论的基础上利用基于前缀的等价关系将搜索空间划分为较小的子空间 |