为啥pickle保存的dataframe ,load后与原dataframe不相等?
前言
昨晚用np.save将多个list保存为.npz文件,load后发现加载的不再是list,而是np.array,倒腾了好一阵才把np.array转为自己用得顺手的格式。今晚用它保存dataframe,结果load后发现丢失了表头和索引名称。
于是乎,弃而选择pickle,load后 print(ori_dataframe == load_dataframe)得到的是 False 。不死心测试了几遍,皆为False 。通过肉眼和简单的print,仔细比较原dataframe(ori_dataframe)与加载的dataframe(load_dataframe),终于发现二者的不同之处是由于表中存在Nan ,而 Nan!= Nan,于是导致了False。
提示:以下是本篇文章正文内容,下面案例可供参考
一、用pickle如何保存并重载dataframe?
代码如下(示例):
## 1. 将dataframe保存为csv
ori_dataframe.to_pickle('D:/WYT/敏感性分析/多元分析/save_nsamples_%s_dfPP_orig_on_%s_test.csv'%(nsamples,site))
## 2. load保存的csv
load_dataframe = pd.read_pickle('D:/WYT/敏感性分析/多元分析/save_nsamples_%s_dfPP_orig_on_%s_test.csv'%(nsamples,site))
## 3 检查二者是否一致
print(ori_dataframe==load_dataframe)
## 4 输出结果显示二者不相等!
Out[41]:
DVS LAI TAGP TWSO TWLV ... TWRT TRA RD SM WWLOW
day .