解决错误TypeError: data argument can't be an iterator

最新推荐文章于 2023-02-14 14:59:01 发布

哆啦AA梦

最新推荐文章于 2023-02-14 14:59:01 发布

阅读量7.6k

点赞数 3

分类专栏： python数据分析与挖掘实战文章标签： python

本文链接：https://blog.csdn.net/y1535766478/article/details/75332961

版权

python数据分析与挖掘实战专栏收录该内容

10 篇文章 3 订阅

订阅专栏

在学习《python数据分析与挖掘实战》第八章时，运行Apriori报错，源代码如下：

#-*- coding: utf-8 -*-
from __future__ import print_function
import pandas as pd
from apriori import * #导入自行编写的apriori函数
import time #导入时间库用来计算用时

inputfile = r'...\chapter8\demo\data\apriori.txt' #输入事务集文件
data = pd.read_csv(inputfile, header=None, dtype = object)

start = time.clock() #计时开始
print(u'\n转换原始数据至0-1矩阵...')
ct = lambda x: pd.Series(1, index=x[pd.notnull(x)]) #转换0-1矩阵的过渡函数
b = map(ct, data.as_matrix()) #用map方式执行
data = pd.DataFrame(b).fillna(0) #实现矩阵转换，空值用0填充
end = time.clock() #计时结束
print(u'\n转换完毕，用时：%0.2f秒' %(end-start))
del b #删除中间变量b，节省内存

support = 0.06 #最小支持度
confidence = 0.75 #最小置信度
ms = '---' #连接符，默认'--'，用来区分不同元素，如A--B。需要保证原始表格中不含有该字符

start = time.clock() #计时开始
print(u'\n开始搜索关联规则...')
find_rule(data, support, confidence, ms)
end = time.clock() #计时结束
print(u'\n搜索完成，用时：%0.2f秒' %(end-start))