关联规则挖掘的算法——Apriori算法

最新推荐文章于 2024-05-31 16:54:13 发布

guitacom

最新推荐文章于 2024-05-31 16:54:13 发布

阅读量1w

点赞数

文章标签：算法数据库优化 each 工作

本文链接：https://blog.csdn.net/guitacom/article/details/1814310

版权

本文深入探讨了关联规则挖掘中的Apriori算法，它是一种经典的数据库优化技术，通过迭代生成频繁项集来发现商品之间的关联性。Apriori原理在于通过每个阶段的候选集生成和交易数据库的连接，有效地减少搜索空间。在实际工作中，Apriori算法被广泛应用于市场篮子分析，帮助商家理解消费者的购买行为。

摘要由CSDN通过智能技术生成

Agrawal等于1993年[1]首先提出了挖掘顾客交易数据库中项集间的关联规则问题，其核心方法是基于频集理论的递推方法。以后诸多的研究人员对关联规则的挖掘问题进行了大量的研究。他们的工作包括对原有的算法进行优化，如引入随机采样、并行的思想等，以提高算法挖掘规则的效率；提出各种变体，如泛化的关联规则、周期关联规则等，对关联规则的应用进行推广。

一、Apriori算法基本原理

Agrawal等在1993年设计了一个基本算法Apriori^[4]，这是一个基于两阶段频集思想的方法，将关联规则挖掘算法的设计可以分解为两个子问题：

1. 找到所有支持度大于最小支持度的项集（Itemset），这些项集称为频集（Frequent Itemset)。

2. 使用第1步找到的频集产生期望的规则。

为生成所有频繁项集，A