字典
字典创建:
dic = {'x1':[1,2,3,4,5],'x2':[1,2,3,5,5]}
按列表生成字典的键:
seq = list(DATAFRAME.columns[0:-1])
dict1 = dict.fromkeys(seq)
为字典的键赋值:
for k in list(dict1.keys()):
dict1[k] = data
若值为列表,取出字典值中的片段:
data_split = dict1[k][:3]
Dataframe
导入的excel、csv文件,一般格式为Dataframe
以列表取出excel表格的列名称:
in_data.columns[0:-1] #excel除Y值的列(特征)名称
seq = list(in_data.columns[0:-1]) #将列名称以列表形式存储
以列表形式取出excel表格的某一列值:
注意若要对取出的值进行修改则先要对其进行copy()操作,否则报warning
var = in_data[key].copy()
字典转化为Dataframe:
当字典每个键值的长度相同时
df2 = pd.DataFrame.from_dict(dict1)
文件I/O
打开excel文件:
输入为Dataframe
in_data = pd.read_excel(filePath)
写出为csv文件:
此处注意,要先转化为dataframe再输出到csv文件中。
而若单纯使用pd.DataFrame(dict)则有可能使字典中键对应的值为一个列表,输出到csv也是一个列表,故还是使用pd.DataFrame.from_dict(dict)
另,header为是否显示列名称,index为是否显示行索引
df2 = pd.DataFrame.from_dict(out_dic2)
df2.to_csv('filename.csv', sep=',', header=True, index=0)
打开/写入/关闭txt文件:
txt文件只可写入string字符串
df=open('name.txt','w+')
df.write(str1)
df.write('\n')
df.close()