apriori算法Python实现

最新推荐文章于 2021-08-14 16:11:39 发布

记忆中绽放那花

最新推荐文章于 2021-08-14 16:11:39 发布

阅读量441

点赞数

分类专栏： python 文章标签：数据挖掘 python

本文链接：https://blog.csdn.net/weixin_44722110/article/details/106063501

版权

本文详细介绍了如何使用Python实现Apriori算法，包括生成候选集、计算支持度、剪枝以及找到关联规则的过程。通过示例数据集展示了如何应用该算法并输出满足最小支持度和最小置信度的关联规则。

摘要由CSDN通过智能技术生成

import numpy as np
import pandas as pd


## 方法一：
def generate_C1(data_set):
    c1 = set()
    for items in data_set:
        for item in items:
            item_set = frozenset([item])
            c1.add(item_set)
    return c1

#计算Ck在数据集D中的支持度，并返回支持度大于minSupport的数据集
def get_supports(data_set, ck, min_support,supports):
    freq_set = set()
    item_count = {}
    # supports = {}
    for data in data_set:
        for item in ck:
            if item.issubset(data):
                if item not in item_count:
                    item_count[item] = 1
                else:
                    item_count[item] += 1

    n= float(len(data_set))
    for item in item_count:
        if (item_count[item] / n) >= min_support:
            freq_set.add(item)
            supports[item] = item_count[item] / n

    return freq_set

#剪枝
def get_new_set(d, k):
    new_set = set()
    n = len(d)
    freqset_list =