python apriori算法 sklearn_《数据挖掘导论》实验课——实验六、数据挖掘之关联分析...

Joey Jiao

于 2021-01-13 18:11:59 发布

阅读量611

点赞数

文章标签： python apriori算法 sklearn

本文链接：https://blog.csdn.net/weixin_29144259/article/details/112890978

版权

实验六、数据挖掘之关联分析一、实验目的1. 理解Apriori算法的基本原理2. 理解FP增长算法的基本原理3. 学会用python实现Apriori算法4. 学会用python实现FP增长算法二、实验工具1. Anaconda2. sklearn3. Pandas三、实验简介Apriori算法在发现关联规则领域具有很大影响力。算法命名源于算法使用了频繁项集性质的先验(prior)知识。在具体实验...

摘要由CSDN通过智能技术生成

实验六、数据挖掘之关联分析

一、实验目的

1. 理解Apriori算法的基本原理

2. 理解FP增长算法的基本原理

3. 学会用python实现Apriori算法

4. 学会用python实现FP增长算法

二、实验工具

1. Anaconda

2. sklearn

3. Pandas

三、实验简介

Apriori算法在发现关联规则领域具有很大影响力。算法命名源于算法使用了频繁项集性质的先验(prior)知识。在具体实验时，Apriori算法将发现关联规则的过程分为两个步骤：第一步通过迭代，检索出事务数据库中的所有频繁项集，即支持度不低于用户设定的阈值的项集；第二步利用频繁项集构造出满足用户最小信任度的规则。其中，挖掘或识别出所有频繁项集是该算法的核心，占整个计算量的大部分。

在对深度优先数据挖掘算法的研究工作中，Han等人没有采用潜在频繁项集的方法求解频繁项集，而是提出了称为频率模式增长(FP_growth)的算法。该算法通过扫描数据库创建FP_tree的根节点并标示为null，对数据库D中的每一个事务Tran，按L中的次序对Tran中的频繁项排序，设Tran中排序后的频繁项列表[p|P]，这里p是第一个元素，P是保留列表。接着调用函数insert_tree([p|P]，T)，如果树T有一个子节点N且N.item_name=p.item_name，就将N节点计数加1；否则就创建一个新节点N，设计数为1，它的父节点连接到T，节点连接到同名的节点连接结构上。如果P是非空的，就递归调用insert_tree(P，N)。由于压缩了数据库内容，并且在将频繁项

最低0.47元/天解锁文章

Joey Jiao

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
python apriori算法 sklearn_《数据挖掘导论》实验课——实验六、数据挖掘之关联分析...

实验六、数据挖掘之关联分析一、实验目的1. 理解Apriori算法的基本原理2. 理解FP增长算法的基本原理3. 学会用python实现Apriori算法4. 学会用python实现FP增长算法二、实验工具1. Anaconda2. sklearn3. Pandas三、实验简介Apriori算法在发现关联规则领域具有很大影响力。算法命名源于算法使用了频繁项集性质的先验(prior)知识。在具体实验...
复制链接

扫一扫