Apriori 算法学习

最新推荐文章于 2024-08-18 17:01:18 发布

old-windbell

最新推荐文章于 2024-08-18 17:01:18 发布

阅读量481

点赞数

分类专栏： C++ 算法数据挖掘文章标签：数据挖掘算法 Apriori

本文链接：https://blog.csdn.net/u012484658/article/details/46317519

版权

本文介绍了数据挖掘中的Apriori算法，详细阐述了其基础概念、逐层搜索的迭代方法以及连接和剪枝步骤。通过具体例子和伪代码展示了Apriori算法的工作流程，帮助读者深入理解该算法的原理及其在关联分析中的应用。

摘要由CSDN通过智能技术生成

近来小看关联分析的Apriori算法，参考《数据挖掘:概念与技术3rd》,作此篇。

1. 基础概念

-支持度（Support）：support( A => B ) = P(A U B)
-置信度（Confidence）： confidence(A => B ) = P( B | A )
-项集(itemset) :　包含K个项的项集成为K项集
-频繁项集(frequent itemset) : 如果项集 I 满足最小支持度阈值, 则 I 是频繁项集

2. 算法简介

2.1 简介

Apriori算法使用频繁项集的先验知识，使用一种称作逐层搜索的迭代方法，k项集用于探索(k+1)项集。
首先，通过扫描事务记录，找出所有的频繁1项集，记做L1，利用L1找频繁2项集L2，使用L2找L3，如此下去，直到不能再找到任何频繁k项集。
为了提高频繁项集逐层产生的效率,一种称为先验性质(Apriori property)的重要性质用于压缩搜索空间.
先验性质:频繁项集的所有非空子集也一定是频繁的.