python的pickle.dump()和pickle.load()-CSDN博客

本文链接：https://blog.csdn.net/changzi990/article/details/139632234

本文介绍了Python的pickle.dump()和pickle.load()函数，用于对象的序列化和反序列化。pickle.dump()将Python对象转换为字节流并写入文件，而pickle.load()则从文件读取字节流并恢复为Python对象。虽然这两个函数方便数据存储和传输，但需要注意安全问题，不应用于不可信数据。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

（1）pickle.dump()

pickle.dump()是Python标准库中的一个函数，用于将Python对象序列化并保存到文件中。

函数签名：

pickle.dump(obj, file, protocol=None, fix_imports=True, buffer_callback=None)

参数说明：

obj：要序列化的Python对象。

file：要保存到的文件对象。一个具有 write() 方法的文件类对象。可以是一个文件名的字符串，也可以是一个已经打开的文件对象。

protocol：可选参数，指定序列化的协议版本。可以是 0 到最高支持的协议，默认为最高协议版本。

fix_imports：可选参数，控制是否修复导入。默认为True，表示在反序列化时自动修复导入。如果为 True，并且 protocol 小于 3，pickle 将尝试将新的 Python 3.x 名称映射到 Python 2.x 中的模块名称。

buffer_callback (可选，callable): 用于优化大型对象序列化的回调函数。

返回值: 无返回值。
代码示例:

import pickle

# 假设我们有一个字典对象

data = {'a': [1, 2.0, 3, 4+6j],

'b': ('string', u'Unicode string'),

'c': None}

# 打开一个文件用于写入

with open('data.pickle', 'wb') as f:

# 将字典对象序列化并保存到文件

pickle.dump(data, f)

pickle.dump()函数将Python对象序列化为字节流，并将字节流写入文件中。序列化的过程将对象转换为一种可以在不同平台和不同版本的Python中进行传输和存储的格式。反序列化时，可以使用pickle.load()函数从文件中读取字节流，并将其转换回原始的Python对象。

需要注意的是，pickle模块在序列化和反序列化时，会将对象的状态保存为字节流，因此可以用于保存和恢复复杂的数据结构，包括自定义的类和对象。但是，由于pickle模块的设计目标是在Python之间进行对象传输和存储，因此不建议将pickle用于不受信任的数据，以避免安全风险。

在给定的代码中，pickle.dump()函数被用于将result_part对象序列化并保存到临时目录中的一个文件中。这样可以将每个进程的部分结果保存到磁盘上，以便后续的合并操作。在合并时，使用pickle.load()函数从文件中读取序列化的部分结果，并将其转换回原始的Python对象。
————————————————

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

原文链接：https://blog.csdn.net/nuliliq/article/details/131827216

（2）pickle.load()

定义: pickle.load(file, *, fix_imports=True, encoding='ASCII', errors='strict', buffers=None) 从文件对象中读取序列化的数据，并将其反序列化为 Python 对象。

参数:
- file (必需，file object): 一个具有 read() 和 readline() 方法的文件类对象，将从该对象中读取并反序列化 pickle 数据。
- fix_imports (可选，布尔值): 是否为了兼容 Python 2.x 修复导入问题。
- encoding (可选，字符串): 用于解码 8 位字符串的编码。
- errors (可选，字符串): 设置如何处理编解码错误。
- buffers (可选，列表): 包含用于优化序列化的缓冲区的列表。
返回值: 反序列化后的 Python 对象。
用途: 从文件中恢复 Python 对象。
代码示例: