Python两步实现关联规则Apriori算法，参考机器学习实战，包括频繁项集的构建以及关联规则的挖掘

最新推荐文章于 2024-05-26 18:53:36 发布

Laurel1115

最新推荐文章于 2024-05-26 18:53:36 发布

阅读量2.8k

点赞数

分类专栏：数据挖掘/机器学习算法实现文章标签：数据挖掘算法实现机器学习实战

本文链接：https://blog.csdn.net/Laurel1115/article/details/87936233

版权

本文介绍了如何使用Python实现关联规则的Apriori算法，分为构建频繁项集和挖掘关联规则两部分。作者根据《机器学习实战》进行实践，并在代码中添加详细注释和测试数据，便于理解。

摘要由CSDN通过智能技术生成

这是我学习了关联规则Apriori算法原理后参照《机器学习实战》实现的算法代码，首先分为两个部分，第一部分是频繁项集的构建，第二部分是关联规则的挖掘。特别的是我的测试数据也就是loadDataSet()函数中的数据进行了改变，这是为了能帮助理解第二部分。然后代码中我加了很多为了让自己理解的输出测试，保留在里面，应该也能帮助大家理解

一、构建频繁项集（注释都在代码中了）

from numpy import *

def loadDataSet():
    return [[1, 3, 4,6,7], [2, 3, 4,5,6,7], [1, 2, 3, 5,7], [2,4, 5,6],[3,4,5,6,7]]

def createC1(dataSet):
    C1 = []
    for transaction in dataSet:
        for item in transaction:
            if not [item] in C1:
                C1.append([item])
                
    C1.sort()
    return map(frozenset, C1)#use frozen set so we can use it as a key in a dict    

def scanD(D, Ck, minSupport):
    ssCnt = {
   }
    for tid in D:
        for can in Ck:
            if can

最低0.47元/天解锁文章

Laurel1115

关注

0
点赞
踩
19

收藏

觉得还不错? 一键收藏
2
评论
Python两步实现关联规则Apriori算法，参考机器学习实战，包括频繁项集的构建以及关联规则的挖掘

Apriori算法的实现一、构建频繁项集（注释都在代码中了）二、基于构造出的频繁项集挖掘关联规则（注释都在代码中了）这是我学习了关联规则Apriori算法原理后参照《机器学习实战》实现的算法代码，首先分为两个部分，第一部分是频繁项集的构建，第二部分是关联规则的挖掘。特别的是我的测试数据也就是loadDataSet()函数中的数据进行了改变，这是为了能帮助理解第二部分。然后代码中我加了很多为了让自...
复制链接

扫一扫

专栏目录