Python两步实现关联规则Apriori算法,参考机器学习实战,包括频繁项集的构建以及关联规则的挖掘

本文介绍了如何使用Python实现关联规则的Apriori算法,分为构建频繁项集和挖掘关联规则两部分。作者根据《机器学习实战》进行实践,并在代码中添加详细注释和测试数据,便于理解。
摘要由CSDN通过智能技术生成

这是我学习了关联规则Apriori算法原理后参照《机器学习实战》实现的算法代码,首先分为两个部分,第一部分是频繁项集的构建,第二部分是关联规则的挖掘。特别的是我的测试数据也就是loadDataSet()函数中的数据进行了改变,这是为了能帮助理解第二部分。然后代码中我加了很多为了让自己理解的输出测试,保留在里面,应该也能帮助大家理解

一、构建频繁项集(注释都在代码中了)

from numpy import *

def loadDataSet():
    return [[1, 3, 4,6,7], [2, 3, 4,5,6,7], [1, 2, 3, 5,7], [2,4, 5,6],[3,4,5,6,7]]

def createC1(dataSet):
    C1 = []
    for transaction in dataSet:
        for item in transaction:
            if not [item] in C1:
                C1.append([item])
                
    C1.sort()
    return map(frozenset, C1)#use frozen set so we can use it as a key in a dict    

def scanD(D, Ck, minSupport):
    ssCnt = {
   }
    for tid in D:
        for can in Ck:
            if can
  • 0
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值