Python3:文本关联规则挖掘实现案例分析

本文介绍了Python3中进行文本关联规则挖掘的过程,重点讲解了置信度的概念,并分享了实现代码,展示了支持度的计算方法。通过实例分析,帮助读者深入理解关联规则挖掘。
摘要由CSDN通过智能技术生成

生成的规则图如下所示:
在这里插入图片描述

支持度

Support(支持度):表示同时包含A和B的事务占所有事务的比例。如果用P(A)表示使用A事务的比例,那么Support=P(A&B)

苍天不负有心人啊,我玩了两三个周的文本关联规则挖掘,终于实现了,我心甚慰!!!甚慰
好啦,废话不多说,上干货

置信度


Confidence(可信度):表示使用包含A的事务中同时包含B事务的比例,即同时包含A和B的事务占包含A事务的比例

实现代码

import random
import numpy as np
class Association_rules:
    def __init__(self,minSupport=0.2,minConfidence=0.5):
        '''
  minSuport:最小支持度
  minConfidence:最小置信度
  dataset:数据集
  count:存放frequent itemsets 以及 support
  associationRules:满足minConfidence的关联规则
  num:元素数量
  threshold = num*minSupport:由num和minSupport算出的阈值
  '''
        self.minSupport = minSupport
        self.minConfidence = minConfidence
        self.dataset = None
        self.count = None
        self.associationRules = None
        self.num = 0
        self.threshold = 0
 
 #计算frequent itemset
    def countItem(self,upDict,elength):
        currentDict = {}
        element = list(upDict.keys())
        for i in range(len(element)-1):
            for j in range(i+1,len(element)):
                if elength-2 <1:
                    tmp=[]
                    tmp.append(element[i])
                    tmp.a
  • 6
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值