Apriori关联规则算法实现——python(anaconda)

导入需要的包

import pandas as pd
import numpy as np

读取csv文件
在这里插入图片描述

path = r"D:\postgraduate\study\data_mining\test\guanxinbing.csv"
data_datafram = pd.read_csv(path,encoding="gbk")

由于读取到的数据是datafram,所以先将pandas读取的数据转化为array

data_array = np.array(data_datafram)

然后转化为list形式

data_list =data_array.tolist()

获取列名(表头)

name = data_datafram.columns.values

按照0,1对应为列名

medicine = []
for i in range(356):
    num = data_list[i]
    case = zip(name,num)
    temp_list = []
    for j in case:
        if j[1] == 1.0:
            temp_list.append(j[0])
    medicine.append(temp_list)

导入包,进行关联规则分析

from efficient_apriori import apriori
transactions = medicine
itemsets,rules = apriori(transactions,
                         min_support = 0.1,
                         min_confidence= 0.7)
print(itemsets,'\n')
for i in rules:
    print(i)

使用 pip install pip install efficient_apriori 安装pip install efficient_apriori

输出结果为在这里插入图片描述
补充:

csv文件是一种用逗号和换行区分数据记录和字段的文件结构,
可以用excel表格编辑,也可以用记事本编辑,是一种类似于excel的数据存储文件。
pandas提供了pd.read_csv()方法可以读取其中的数据并且转换成DataFrame的数据类型。

DataFrame是一种表格型数据结构
它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型等),DataFrame既有行索引(index)也有列索引(column)。
DataFrame可以根据dict进行创建,或通过读取csv或者txt文件来创建。

  • 4
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值