Python算法总结（十一）Apriori算法（附手写python实现代码）

最新推荐文章于 2024-05-23 10:20:41 发布

陈同学2020

最新推荐文章于 2024-05-23 10:20:41 发布

阅读量6.9k

点赞数 14

分类专栏： python算法

本文链接：https://blog.csdn.net/cqx2020/article/details/107061461

版权

一、算法类型

无监督算法

（小广告）重要事情说三遍~

想听我讲代码，请点这里，进入B站
 想听我讲代码，请点这里，进入B站
 想听我讲代码，请点这里，进入B站

二、算法原理

（1）算法流程
在这里插入图片描述
（2）指标

三、手写Python算法

（1）产生频繁项集

def create_c1(dataset):
    """
    #辅助函数1
    函数功能：⽣成第⼀个候选项集c1，每个项集只有1个item
    参数说明：
     dataset：原始数据集
    返回：
     frozenset形式的候选集合c1
    """
    c1=[]
    for transaction in dataset:
        for item in transaction:
            if not {
   item} in c1:
                c1.append({
   item})
    c1.sort()
    return list(map(frozenset,c1))

def create_freq_transaction(dataset,ck,min_support=0.5):
    """
    #辅助函数2
    函数功能：⽣成满⾜最⼩⽀持度的频繁项集
    参数说明:
     dataset:原始数据集
     ck:候选项集
     min_support:最⼩⽀持度
    返回：
    support_data：候选项集ck的⽀持度字典(key:候选项， value:⽀持度)
    freq_transaction：给定min_support下的ck中的频繁项集
    
    注意：如果ck中得不到频繁项集，则返回的是空list
    """
    sscnt={
   } #存放项集及频次
    for transaction in dataset:
        for can in ck: #候选项集
            if can.issubset(transaction):
                sscnt[can]=sscnt.get(can,0)+1 #频次&

最低0.47元/天解锁文章

陈同学2020

关注

14
点赞
踩
73

收藏

觉得还不错? 一键收藏
2
评论
Python算法总结（十一）Apriori算法（附手写python实现代码）

一、算法类型无监督算法二、算法原理（1）算法流程（2）指标三、手写Python算法（1）产生频繁项集def create_c1(dataset): """ #辅助函数1 函数功能：⽣成第⼀个候选项集c1，每个项集只有1个item 参数说明： dataset：原始数据集返回： frozenset形式的候选集合c1 """ c1=[] for transaction in dataset: f
复制链接

扫一扫