数据挖掘之Aprior算法

最新推荐文章于 2022-12-22 15:42:17 发布

品味orphaned

最新推荐文章于 2022-12-22 15:42:17 发布

阅读量595

点赞数

分类专栏：数据挖掘文章标签：经典Apriori算法简单例子

本文链接：https://blog.csdn.net/u010472256/article/details/52653677

版权

0 篇文章 0 订阅

订阅专栏

关联规则Aprior算法，我看过很多书，但是都没有看太明白，今天看到一本讲数据挖掘的书《数据挖掘：概念、模型、方法和算法》，里面讲的特别清楚，每一步都特别详细，故把它记录下来。首先看一个表，这个表时一个简单事务数据库的模型：

假定最小支持度s = 50%,所以。只有在至少50%的事务中都出现的项集才是频繁项集。

在第一次迭代的第一步中，所有单个项都作为候选集，它的生成阶段，计数阶段和选择阶段如下：

(c1)选择阶段

在第二次迭代中，它的生成阶段由(c1)选择阶段中的项集两两构成，计数阶段和选择阶段如下：

（c2）选择阶段

在第3次迭代中，它的生成阶段由(c2)选择阶段中的项集两两构成，计数阶段和选择阶段如下：

（a3）生成阶段
3-项集C_3
{B， C， E}

（b3）计数阶段
3-项集	计数	s[%]
{B, C, E }	2	50

（c3）选择阶段
大3-项集L_3	计数	s[%]
{B， C，E}	2	50

在例子中，L_3无法产生候选的4-项集，所以Apriori算法停止迭代过程。

以上为经典的Apriori算法的例子。

关注

专栏目录