关联分析-FP树法python注解

本文介绍了使用Python实现FP树关联分析的过程,包括定义树结构、创建与更新树、制作测试数据、输出路径等步骤。文章指出支持度的不足,并提出使用兴趣因子优化,通过比较联合概率与独立概率来判断项集的相关性。
摘要由CSDN通过智能技术生成

定义树的结构

class treeNode:
    def __init__(self,nameValue,numOccur,parentNode):
        self.name = nameValue #值
        self.count = numOccur #计数
        self.nodeLink = None #横向链
        self.parent = parentNode #父亲节点
        self.children = {}   #儿子节点
    def inc(self,numOccur):
        self.count += numOccur
    def disp(self,ind = 1):   #输出显示
        print ' ' * ind,self.name,' ',self.count
        for child in self.children.values():
            child.disp(ind + 1)

创建树

主要目的是将数据一行一行插入字典树里面,但是先进行了过滤操作,删除了一些不可能出现的项集,并且对记录进行了排序.

#dataSet是记录,minSup是最小支持度
def createTree(dataSet,minSup=1):
    #对每个元素进行计数
    headerTable = {}
    
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值