关联算法,特征算法python实现

本文介绍了如何使用Python进行数据关联分析,重点探讨了Apriori算法的实现,并涉及特征选择的过程,旨在提升大数据挖掘的效果。
摘要由CSDN通过智能技术生成

利用python对数据关联分析,实现Apriori算法

def apriori(D, minSup):
    '''频繁项集用keys表示,
    key表示项集中的某一项,
    cutKeys表示经过剪枝步的某k项集。
    C表示某k项集的每一项在事务数据库D中的支持计数
    '''
    #先求出1项集合及其支持计数,注意此处C1是字典,key为项集,value是计数
    C1 = {
   }
    for T in D:
        for I in T:
            if I in C1:
                C1[I] += 1
            else:
                C1[I] = 1

    print(C1)
    _keys1 = C1.keys()

    keys1 = []
    for i in _keys1:
        keys1.append([i])

    n = len(D)
    cutKeys1 = []
    #对keys1(1项集)进行剪枝步
    for k in keys1[:]:
        if C1[k[0]] * 1.0 / n >= minSup:
            cutKeys1.append
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值