_pickle.UnpicklingError: invalid load key, ‘\x00‘. 解决方案

问题描述

  • 编程语言:Python
  • 系统:MacOS
  • 功能实现:遍历某个文件夹下的所有pickle文件,然后对读取的文件进行处理
  • 代码片段:
import pickle
import os
for root, dirs, files in os.walk(args.input_dir):
	for f in files:
        file = pickle.load(open(os.path.join(root, f), 'rb'))
        ...
  • 报错信息:
    _pickle.UnpicklingError: invalid load key, ‘\x00’

问题原因

文件只包含空值、空格或tab类似的值,无法读取。
由于MacOS系统中默认每个文件夹都有.DS_Store文件,在使用os.walk的时候也会遍历到这个文件,导致读取为空

问题解决方法

加入对文件的判断

import pickle
import os
for root, dirs, files in os.walk(args.input_dir):
	for f in files:
		if f == ".DS_Store":
			continue
        file = pickle.load(open(os.path.join(root, f), 'rb'))
        ...

参考网址

【1】https://stackoverflow.com/questions/58889307/invalid-load-key-x00-issue-in-unplicling

### Python 中 `_pickle.UnpicklingError: invalid load key` 错误分析 此错误通常发生在尝试加载由 `pickle` 序列化的对象时,如果文件损坏、格式不正确或者不是有效的 `pickle` 数据,则会抛出此类异常。以下是对此问题的深入解析: #### 1. **_pickle.UnpicklingError 的原因** 该错误表明在反序列化过程中遇到了无法识别的负载键(load key)。这可能是由于以下原因之一引起的: - 文件被意外修改或截断[^1]。 - 尝试解码的内容并非通过 `pickle.dump()` 或类似的函数生成的有效数据。 - 使用了不同的版本或编码方式保存和读取数据。 #### 2. **解决方案** ##### 方法一:验证输入源 确认所处理的数据确实是由 `pickle` 创建的二进制流。可以通过打印原始字节来初步判断其合法性。例如: ```python with open('data.pkl', 'rb') as f: data = f.read() print(data[:10]) # 查看前几个字节是否合理 ``` ##### 方法二:指定正确的协议版本 不同版本间的兼容性可能导致问题。可以显式设置协议号以匹配写入时使用的版本。例如,在存储阶段采用特定协议编号: ```python import pickle # 存储时指定协议版本 with open('data.pkl', 'wb') as f: pickle.dump(obj, f, protocol=4) # 协议号可选范围为0到最高支持值 ``` 而在恢复期间也应保持一致: ```python with open('data.pkl', 'rb') as f: obj = pickle.load(f, encoding='bytes') ``` ##### 方法三:捕获并调试异常 利用异常机制定位具体失败位置,并记录上下文信息以便进一步排查。如下所示: ```python try: with open('corrupted_file.pkl', 'rb') as file: loaded_data = pickle.load(file) except _pickle.UnpicklingError as e: print(f"Unpickling failed due to {e}") ``` #### 3. **其他注意事项** 当遇到数值转换类错误时,如 `(Pdb) int(x)` 抛出了 `ValueError`, 这意味着试图将非整数字符串转化为整型操作失败了[^2]。此时需先确保目标变量能成功转变为浮点数再做后续运算,比如使用 `round(float(x))`. 另外关于泛型提示中的自定义类型约束表达式 `TypeVar("SelfBaseAlgorithm", bound="BaseAlgorithm")` 是为了实现更严格的静态类型检查而设计的[^3], 它与当前讨论的主题无直接关联. ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值