Python数据的标准存储方案Pickle

刷完这60个标准库模块,成为Python骨灰级玩家

在介绍pickle之前,复习一下eval可以起到提神醒脑的作用,eval是一个不太安全的东西,因为可以实现将字符串转为代码,并执行。

例如

>>> eval("print(1)")
1

如果乱用这个函数,就会把别人恶意写出的字符串代码执行,导致灾难性的后果。

pickle可以用二进制表示python中的数据,并存储下来,而且能够重新读取。所以这也是一个不安全的功能,如果把一个pickle暴露给别人,那万一遇到了坏人,同样有被植入恶意程序的风险。

加载和保存

pickle中有两组加载和保存函数

加载保存
交互文件dumpload
交互字节码dumpsloads

例如

x = [i**2 for i in range(10)]
import pickle
s = pickle.dumps(x)
print(s)
# b'\x80\x04\x95\x19\x00\x00\x00\x00\x00\x00\x00]\x94(K\x00K\x01K\x04K\tK\x10K\x19K$K1K@KQe.'
with open("test.pickle", 'wb') as f:
   pickle.dump(x, f)        # 将x存为f

x存储为文件之后,还可以重新打开

with open("test.pickle", 'rb') as f:
    y = pickle.load(f)

print(y)
# [0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

注意事项

除了不够安全之外,使用pickle另外一个需要注意的是,到目前为止,pickle已经有6个版本,其中v0v1版本过于古老,基本没什么能用的地方;v3以后的版本则不再支持Python2.x,下表列出了自v2v5的一些更新特性

引入版本文档
v2Python 2.3PEP307为 新式类 提供了更高效的封存机制。
v3Python 3.0显式地支持字节对象
为Python 3.0-3.7 的默认协议。
v4Python 3.4PEP 3154支持存储较大对象,并针对数据格式进行了优化
Python 3.8使用的默认协议。
v5Python 3.8PEP 574增加对带外数据的支持,并可加速带内数据处理

理论上讲,pickle可以封装一切python对象,所以对于一些比较耗时的算法,可以通过pickle来保存当前的状态。

但要注意的是,尽管pickle可以封存函数,但并不能封存匿名函数

>>> test = lambda x : x
>>> s = pickle.dumps(test)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
_pickle.PicklingError: Can't pickle <function <lambda> at 0x00000207E76C7F70>: attribute lookup <lambda> on __main__ failed
>>> def test(x):
...   print(x)
...
>>> s = pickle.dumps(test)
>>> print(s)
b'\x80\x04\x95\x15\x00\x00\x00\x00\x00\x00\x00\x8c\x08__main__\x94\x8c\x04test\x94\x93\x94.'

其他包库的支持

pandas中提供了to_pickle,可将数据帧或系列转化为pickle

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

微小冷

请我喝杯咖啡

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值