Map的问题

map类型的变量经过转化成list调用后再次调用为空

之所以会这样,原因在于:遍历完最后一个元素后,再次访问时会放回空列表。我们也可以这样理解:由于python中“没有指针,但是所有对象均为指针”,完成一次遍历后指针会移到最后一个元素上了。也就是说,D是一个map object,print(list(D))或者for循环打印D中的元素,都会导致迭代器从头走到尾(可以类比list[0]到list[n])。 而迭代器是一个单向的容器,走到尾部之后,不会自动再回到开始位置。 所以,对Map对象进行一次for循环之后,Map就相当于“空”了。

dataSet = [[1,3,4],[2,3,5],[1,2,3,5],[2,5]]
num = 0
D = map(set,dataSet)
for tid in D:
    num += 1
SS = list(D)
print(SS)

想要二次遍历(访问)Map对象,这里有一种方法可供参考:

------在第一次遍历Map对象之前,先复制拷贝一份,但此时的拷贝需要是深拷贝才行。

代码应该修改如下:

import copy
dataSet = [[1,3,4],[2,3,5],[1,2,3,5],[2,5]]
num = 0
D = map(set,dataSet)
DD = copy.deepcopy(D)
for tid in D:
    num += 1
SS = list(DD)
print(SS)

自己的代码

import pandas as pd

inputfile = 'E:/python data analyse/data/chapter5/demo/data/menu_orders.xls'
outputfile = 'E:/python data analyse/data/chapter5/demo/tmp/apriori_rules.xls' #结果文件
data = pd.read_excel(inputfile, header = None)
print(data)

print(u'\n转换原始数据至0-1矩阵...')
ct = lambda x : pd.Series(1, index = x[pd.notnull(x)]) #转换0-1矩阵的过渡函数
b = map(ct, data.as_matrix()) #用map方式执行
print('data.as_matrix()')
print(data.as_matrix())
print('b')
print(type(b)) #map对象
#print(list(b)) #再次调用list(b),会使list(b)为null
data = pd.DataFrame(list(b)).fillna(0) #实现矩阵转换,空值用0填充
print('data')
print(data)
print(u'\n转换完毕。')
del b #删除中间变量b,节省内存

support = 0.2 #最小支持度
confidence = 0.5 #最小置信度
ms = '---' #连接符,默认'--',用来区分不同元素,如A--B。需要保证原始表格中不含有该字符

至此,此问题就可以得到解决了。

方法参考:

1: http://www.voidcn.com/article/p-bzilygqj-ou.html

2:https://zhuanlan.zhihu.com/p/32162554

转自 https://blog.csdn.net/swety_gxy/article/details/83063499

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值