Python数据存储：pickle模块的使用讲解

最新推荐文章于 2024-03-29 23:58:11 发布

风吹草地现牛羊的马

最新推荐文章于 2024-03-29 23:58:11 发布

阅读量256

点赞数

分类专栏： python

本文链接：https://blog.csdn.net/mch2869253130/article/details/88849729

版权

python 专栏收录该内容

27 篇文章 1 订阅

订阅专栏

在机器学习中，我们常常需要把训练好的模型存储起来，这样在进行决策时直接将模型读出，而不需要重新训练模型，这样就大大节约了时间。Python提供的pickle模块就很好地解决了这个问题，它可以序列化对象并保存到磁盘中，并在需要的时候读取出来，任何对象都可以执行序列化操作。

用于序列化的两个模块
　　json：用于字符串和Python数据类型间进行转换
　　pickle: 用于python特有的类型和python的数据类型间进行转换
　　json提供四个功能：dumps,dump,loads,load
　　pickle提供四个功能：dumps,dump,loads,load

pickle可以存储什么类型的数据呢？

所有python支持的原生类型：布尔值，整数，浮点数，复数，字符串，字节，None。
由任何原生类型组成的列表，元组，字典和集合。
函数，类，类的实例

pickle模块中常用的方法有：

pickle.dump(obj, file, protocol=None,)
函数的功能：将obj对象序列化存入已经打开的file中。
必填参数obj表示将要封装的对象
必填参数file表示obj要写入的文件对象，file必须以二进制可写模式打开，即“wb”
可选参数protocol表示告知pickler使用的协议，支持的协议有0,1,2,3，默认的协议是添加在Python 3中的协议3。
pickle.load(file,*,fix_imports=True, encoding=“ASCII”, errors=“strict”)
函数的功能：将file中的对象序列化读出。
必填参数file必须以二进制可读模式打开，即“rb”，其他都为可选参数
pickle.dumps(obj)：
函数功能：以字节对象（string）形式返回封装的对象，不需要写入文件中
pickle.loads(bytes_object):
函数功能：从字节对象（string）中读取被封装的对象，并返回

# dumps功能
import pickle
data = ['aa', 'bb', 'cc']  
# dumps 将数据通过特殊的形式转换为只有python语言认识的字符串
p_str = pickle.dumps(data)
print(p_str)            
b'\x80\x03]q\x00(X\x02\x00\x00\x00aaq\x01X\x02\x00\x00\x00bbq\x02X\x02\x00\x00\x00ccq\x03e.

# loads功能
# loads  将pickle数据转换为python的数据结构
mes = pickle.loads(p_str)
print(mes)
['aa', 'bb', 'cc']

# dump功能
# dump 将数据通过特殊的形式转换为只有python语言认识的字符串，并写入文件
with open('D:/tmp.pk', 'w') as f:
pickle.dump(data, f)

# load功能
# load 从数据文件中读取数据，并转换为python的数据结构
with open('D:/tmp.pk', 'r') as f:
data = pickle.load(f)

参考：https://www.cnblogs.com/lincappu/p/8296078.html
https://www.cnblogs.com/fmgao-technology/p/9078918.html

风吹草地现牛羊的马

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python数据存储：pickle模块的使用讲解

在机器学习中，我们常常需要把训练好的模型存储起来，这样在进行决策时直接将模型读出，而不需要重新训练模型，这样就大大节约了时间。Python提供的pickle模块就很好地解决了这个问题，它可以序列化对象并保存到磁盘中，并在需要的时候读取出来，任何对象都可以执行序列化操作。用于序列化的两个模块　　json：用于字符串和Python数据类型间进行转换　　pickle: 用于python特有的类型和...
复制链接

扫一扫