亲和性分析_0(python数据挖掘入门与实践-实验1)

最新推荐文章于 2024-03-22 23:55:12 发布

柳家山头号矿工

最新推荐文章于 2024-03-22 23:55:12 发布

阅读量964

点赞数

分类专栏：数据挖掘实验文章标签： python 数据挖掘

本文链接：https://blog.csdn.net/dc12499574/article/details/123592658

版权

支持度置信度关联规则消费者行为数据挖掘

关键词由CSDN通过智能技术生成

数据挖掘实验专栏收录该内容

11 篇文章 1 订阅

订阅专栏

文章目录

解析
思路
效果
代码

解析

支持度：事件发生的总次数
置信度：一定条件下，事件发生的概率

思路

第一步：
导入数据，并交由变量X维护
创建特征数组
获取特征数量

第二步：
创建字典
valid_rules：(a,b):num_i的含义
表示买商品 a 之后，又买了商品 b 的消费者数量
invalid_rules：(a,b):num_i的含义
表示买商品 a 之后，没有买了商品 b 的消费者数量
nums_occurances：(a):num_i的含义
表示买商品 a 的消费者数量

第三步：
遍历 X 每 i 行
primise表示前提，conclusion表示结论
(X [i] [primise])=(1)：表示消费者 i 买features[primise]
(X [i] [primise], X [i] [conclusion])=(1,0)：表示消费者 i 买features[primise]之后, 没买了features[conclusion]
(X [i] [primise], X [i] [conclusion])=(1,1)：表示消费者 i 买features[primise]之后, 还买了features[conclusion]
若(X [i] [primise])=(1)，则nums_occurances(primise)+1
若(X [i] [primise], X [i] [conclusion])=(1,0)，则invalid_rules(primise,conclusion)+1
若(X [i] [primise], X [i] [conclusion])=(1,1)，则valid_rules(primise,conclusion)+1
遍历完成

第四步：
由valid_rules定义可得
支持度=valid_rules
置信度=(1, 1)发生的次数 / ((1, 1)发生的次数+(1, 0)发生的次数)

效果

请添加图片描述

代码

#库导入
import numpy as np
from collections import defaultdict

#导入数据
dataset_filename="D:/Python/Jupyter/Learning-Data-Mining-with-Python-master/Chapter 1/affinity_dataset.txt"
X=np.loadtxt(dataset_filename)
features=['bread','milk','cheese','apple','banana']
nums_feature=len(X[0])

#遍历数据
valid_rules=defaultdict(int)
invalid_rules=defaultdict(int)
nums_occurances=defaultdict(int)
for sample in X:
    for primise in range(nums_feature):
        if sample[primise]==0: continue
        nums_occurances[primise]+=1
        for conclusion in range(nums_feature):
            if conclusion==primise: continue
            if sample[conclusion]==1: valid_rules[(primise,conclusion)]+=1
            else: invalid_rules[(primise,conclusion)]+=1

#支持度
support=valid_rules
#置信度
confidence=defaultdict(float)
for primise,conclusion in valid_rules.keys():
    confidence[(primise,conclusion)]=valid_rules[(primise,conclusion)]/nums_occurances[primise]

#结果展示
for primise,conclusion in confidence.keys():
    print("Rule: If a people buys {0} they will also buy {1}".format(features[primise],features[conclusion]))
    print("- Support: {0}".format(confidence[(primise,conclusion)]))
    print("- Confidence: {0}".format(support[(primise,conclusion)]))

柳家山头号矿工

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
亲和性分析_0(python数据挖掘入门与实践-实验1)

文章目录解析思路效果代码解析支持度：事件发生的总次数置信度：一定条件下，事件发生的概率思路第一步：导入数据，并交由变量X维护创建特征数组获取特征数量第二步：创建字典valid_rules：(a,b):num_i的含义表示买商品 a 之后，又买了商品 b 的消费者数量invalid_rules：(a,b):num_i的含义表示买商品 a 之后，没有买了商品 b 的消费者数量nums_occurances：(a):num_i的含义表示买商品 a 的消费者数量第三步：遍历 X
复制链接

扫一扫

专栏目录