python的pickle.dump()和pickle.load()

本文介绍了Python的pickle.dump()和pickle.load()函数,用于对象的序列化和反序列化。pickle.dump()将Python对象转换为字节流并写入文件,而pickle.load()则从文件读取字节流并恢复为Python对象。虽然这两个函数方便数据存储和传输,但需要注意安全问题,不应用于不可信数据。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

(1)pickle.dump()

pickle.dump()是Python标准库中的一个函数,用于将Python对象序列化并保存到文件中。

函数签名:

pickle.dump(obj, file, protocol=None, fix_imports=True, buffer_callback=None)

  • 参数说明:

obj:要序列化的Python对象。

file:要保存到的文件对象。一个具有 write() 方法的文件类对象。可以是一个文件名的字符串,也可以是一个已经打开的文件对象。

protocol:可选参数,指定序列化的协议版本。可以是 0 到最高支持的协议,默认为最高协议版本。

fix_imports:可选参数,控制是否修复导入。默认为True,表示在反序列化时自动修复导入。如果为 True,并且 protocol 小于 3,pickle 将尝试将新的 Python 3.x 名称映射到 Python 2.x 中的模块名称。

buffer_callback (可选,callable): 用于优化大型对象序列化的回调函数。

  • 返回值: 无返回值。
  • 代码示例:
  • 1

    2

    3

    4

    5

    6

    7

    8

    9

    10

    import pickle

    # 假设我们有一个字典对象

    data = {'a': [1, 2.0, 3, 4+6j],

            'b': ('string', u'Unicode string'),

            'c': None}

    # 打开一个文件用于写入

    with open('data.pickle', 'wb') as f:

        # 将字典对象序列化并保存到文件

        pickle.dump(data, f)

pickle.dump()函数将Python对象序列化为字节流,并将字节流写入文件中。序列化的过程将对象转换为一种可以在不同平台和不同版本的Python中进行传输和存储的格式。反序列化时,可以使用pickle.load()函数从文件中读取字节流,并将其转换回原始的Python对象。

需要注意的是,pickle模块在序列化和反序列化时,会将对象的状态保存为字节流,因此可以用于保存和恢复复杂的数据结构,包括自定义的类和对象。但是,由于pickle模块的设计目标是在Python之间进行对象传输和存储,因此不建议将pickle用于不受信任的数据,以避免安全风险。

在给定的代码中,pickle.dump()函数被用于将result_part对象序列化并保存到临时目录中的一个文件中。这样可以将每个进程的部分结果保存到磁盘上,以便后续的合并操作。在合并时,使用pickle.load()函数从文件中读取序列化的部分结果,并将其转换回原始的Python对象。
————————————————

                            版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
                        
原文链接:https://blog.csdn.net/nuliliq/article/details/131827216

(2)pickle.load()

定义pickle.load(file, *, fix_imports=True, encoding='ASCII', errors='strict', buffers=None) 从文件对象中读取序列化的数据,并将其反序列化为 Python 对象。

  • 参数:
    • file (必需,file object): 一个具有 read() 和 readline() 方法的文件类对象,将从该对象中读取并反序列化 pickle 数据。
    • fix_imports (可选,布尔值): 是否为了兼容 Python 2.x 修复导入问题。
    • encoding (可选,字符串): 用于解码 8 位字符串的编码。
    • errors (可选,字符串): 设置如何处理编解码错误。
    • buffers (可选,列表): 包含用于优化序列化的缓冲区的列表。
  • 返回值: 反序列化后的 Python 对象。
  • 用途: 从文件中恢复 Python 对象。
  • 代码示例:

1

2

3

4

5

6

import pickle

# 打开含有序列化数据的文件

with open('data.pickle', 'rb') as f:

    # 读取并反序列化数据

    data_loaded = pickle.load(f)

    print(data_loaded)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值