假设当前我有一个pandas.DataFrame格式的数据data需要存进csv文件中。
先看看数据的格式
然后保存至csv文件中
data.to_csv('data.csv')
查看文件内容
head -n 2 data.csv
------------------------------------------------
,label_game_finish,u_age,u_face_score,u_gender,uhigh_value,u_mcd_avg,u_mdd_avg
0,0.0,19.0,70.069763,0.0,1.0,6.0,1.0
可以发现存储的时候将第一列的index也存进了csv文件。
将存储后的数据再次读取出来
发现index这一列又重复了,有两个解决方法。
1. 在存储csv文件的时候选择不存储index信息
data.to_csv('data.csv',index=False)
2.读取csv文件的时候选择不读取第一列信息
data = pd.read_csv('data.csv',index_col=0)
建议使用第一种方法,在存储的时候就选择不存index信息,这样后续读取的时候直接使用read_csv(‘data.csv’)就即可,第二种方法是在csv文件已经保存了index这一列的前提下使用的。