map类型的变量经过转化成list调用后再次调用为空
之所以会这样,原因在于:遍历完最后一个元素后,再次访问时会放回空列表。我们也可以这样理解:由于python中“没有指针,但是所有对象均为指针”,完成一次遍历后指针会移到最后一个元素上了。也就是说,D是一个map object,print(list(D))或者for循环打印D中的元素,都会导致迭代器从头走到尾(可以类比list[0]到list[n])。 而迭代器是一个单向的容器,走到尾部之后,不会自动再回到开始位置。 所以,对Map对象进行一次for循环之后,Map就相当于“空”了。
dataSet = [[1,3,4],[2,3,5],[1,2,3,5],[2,5]]
num = 0
D = map(set,dataSet)
for tid in D:
num += 1
SS = list(D)
print(SS)
想要二次遍历(访问)Map对象,这里有一种方法可供参考:
------在第一次遍历Map对象之前,先复制拷贝一份,但此时的拷贝需要是深拷贝才行。
代码应该修改如下:
import copy
dataSet = [[1,3,4],[2,3,5],[1,2,3,5],[2,5]]
num = 0
D = map(set,dataSet)
DD = copy.deepcopy(D)
for tid in D:
num += 1
SS = list(DD)
print(SS)
自己的代码
import pandas as pd
inputfile = 'E:/python data analyse/data/chapter5/demo/data/menu_orders.xls'
outputfile = 'E:/python data analyse/data/chapter5/demo/tmp/apriori_rules.xls' #结果文件
data = pd.read_excel(inputfile, header = None)
print(data)
print(u'\n转换原始数据至0-1矩阵...')
ct = lambda x : pd.Series(1, index = x[pd.notnull(x)]) #转换0-1矩阵的过渡函数
b = map(ct, data.as_matrix()) #用map方式执行
print('data.as_matrix()')
print(data.as_matrix())
print('b')
print(type(b)) #map对象
#print(list(b)) #再次调用list(b),会使list(b)为null
data = pd.DataFrame(list(b)).fillna(0) #实现矩阵转换,空值用0填充
print('data')
print(data)
print(u'\n转换完毕。')
del b #删除中间变量b,节省内存
support = 0.2 #最小支持度
confidence = 0.5 #最小置信度
ms = '---' #连接符,默认'--',用来区分不同元素,如A--B。需要保证原始表格中不含有该字符
至此,此问题就可以得到解决了。
方法参考:
1: http://www.voidcn.com/article/p-bzilygqj-ou.html