国内镜像安装插件:
pip安装使用清华镜像_pip清华镜像-CSDN博客
pandas对象拥有一个to_pickle方法可以将数据以pickle格式写入硬盘
实现数据的⾼效⼆进制格式存储最简单的办法之⼀是使⽤
Python
内置的
pickle
序列化。
pandas
对象都有⼀个⽤于将数据以
pickle
246
格式保存到磁盘上的
to_pickle
⽅法:
In [87]:
frame = pd.read_csv('examples/ex1.csv')
In [88]: frame
Out[88]:
a b c d message
0 1 2 3 4 hello
1 5 6 7 8 world
2 9 10 11 12 foo
In [89
]: frame.to_pickle('examples/frame_pickle')
你可以通过
pickle
直接读取被
pickle
化的数据,或是使⽤更为⽅便
的
pandas.read_pickle
:
In [90]:
pd.read_pickle('examples/frame_pickle')
Out[90]:
a b c d message
0 1 2 3 4 hello
1 5 6 7 8 world
2 9 10 11 12 foo
注意:
pickle
仅建议⽤于短期存储格式。其原因是很难保证该
格式永远是稳定的;今天
pickle
的对象可能⽆法被后续版本的
库
unpickle
出来。虽然我尽⼒保证这种事情不会发⽣在
pandas
中,但是今后的某个时候说不定还是得
“
打破
”
该
pickle
格式
知识点:python内建pickle序列化模块操作是存储数据,to_pickle将数据以pickle格式写入硬盘,read_pickle用于读取硬盘上序列化的数据