(1)pickle.dump()
pickle.dump()是Python标准库中的一个函数,用于将Python对象序列化并保存到文件中。
函数签名:
pickle.dump(obj, file, protocol=None, fix_imports=True, buffer_callback=None)
- 参数说明:
obj:要序列化的Python对象。
file:要保存到的文件对象。一个具有 write() 方法的文件类对象。可以是一个文件名的字符串,也可以是一个已经打开的文件对象。
protocol:可选参数,指定序列化的协议版本。可以是 0 到最高支持的协议,默认为最高协议版本。
fix_imports:可选参数,控制是否修复导入。默认为True,表示在反序列化时自动修复导入。如果为 True,并且 protocol
小于 3,pickle 将尝试将新的 Python 3.x 名称映射到 Python 2.x 中的模块名称。
buffer_callback
(可选,callable): 用于优化大型对象序列化的回调函数。
- 返回值: 无返回值。
- 代码示例:
-
1
2
3
4
5
6
7
8
9
10
import
pickle
# 假设我们有一个字典对象
data =
{
'a'
: [
1
,
2.0
,
3
,
4
+
6j],
'b'
: (
'string'
, u
'Unicode string'),
'c'
:
None}
# 打开一个文件用于写入
with open
(
'data.pickle'
,
'wb') as f:
# 将字典对象序列化并保存到文件
pickle.dump(data, f)
pickle.dump()函数将Python对象序列化为字节流,并将字节流写入文件中。序列化的过程将对象转换为一种可以在不同平台和不同版本的Python中进行传输和存储的格式。反序列化时,可以使用pickle.load()函数从文件中读取字节流,并将其转换回原始的Python对象。
需要注意的是,pickle模块在序列化和反序列化时,会将对象的状态保存为字节流,因此可以用于保存和恢复复杂的数据结构,包括自定义的类和对象。但是,由于pickle模块的设计目标是在Python之间进行对象传输和存储,因此不建议将pickle用于不受信任的数据,以避免安全风险。
在给定的代码中,pickle.dump()函数被用于将result_part对象序列化并保存到临时目录中的一个文件中。这样可以将每个进程的部分结果保存到磁盘上,以便后续的合并操作。在合并时,使用pickle.load()函数从文件中读取序列化的部分结果,并将其转换回原始的Python对象。
————————————————
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
原文链接:https://blog.csdn.net/nuliliq/article/details/131827216
(2)pickle.load()
定义: pickle.load(file, *, fix_imports=True, encoding='ASCII', errors='strict', buffers=None)
从文件对象中读取序列化的数据,并将其反序列化为 Python 对象。
- 参数:
file
(必需,file object): 一个具有 read() 和 readline() 方法的文件类对象,将从该对象中读取并反序列化 pickle 数据。fix_imports
(可选,布尔值): 是否为了兼容 Python 2.x 修复导入问题。encoding
(可选,字符串): 用于解码 8 位字符串的编码。errors
(可选,字符串): 设置如何处理编解码错误。buffers
(可选,列表): 包含用于优化序列化的缓冲区的列表。
- 返回值: 反序列化后的 Python 对象。
- 用途: 从文件中恢复 Python 对象。
- 代码示例:
1 2 3 4 5 6 |
|