PyPDF2 中文设置
PyPDF2 默认是 Latin-1 编码的,当处理中文文档的时候就会报错。
本文内容 Linux 与 Windows 通用 已测试
快速方法:(覆盖文件)
配置文件下载
将下载的 generic.py
和 utils.py
复制到 目录C:\Users\currentuser\AppData\Local\Programs\Python\Python39\Lib\site-packages\PyPDF2
下即可
Linux下find一下
自定义:(自己修改配置文件)
将 utils.py
内大概240行左右的内容:
r = s.encode('latin-1')
if len(s) < 2:
bc[s] = r
return r
修改为