你是否在为下图中的报错所烦恼?烦恼文件的编码格式是什么?一遍又一遍的尝试,换来的只有冰冷的报错,今天我们将用Chardet一雪前耻。
Chardet是 Mozilla 中自动检测代码的端口。作者试图尽可能多地维护原始结构(主要是出于自私的原因,以便随着原始代码的发展更容易维护端口)。由于作者的贡献,我们可以简单快速的使用到这个库。
快速开始
1. 安装库
pip install chardet
2. 检测文件格式(非常简单!!!)
# 代码
import chardet
with open("b.txt", "rb") as f:
print(chardet.detect(f.read()))
我们可以看到原来编码格式是UTF-16,难怪运行不了。运行结果分析:encoding就是文件的编码格式;confidence就是认为是UTF-16的置信度,1.0代表100%是UTF-16;language就不知道是什么,了解的小伙伴评论区说一下的。
result:
{'encoding': 'UTF-16', 'confidence': 1.0, 'language': ''}
结尾
接下来也会持续分享一些简单好用并且提供日常写代码效率的库,如果感兴趣不妨关注一下!!!
如果觉得文章对你有用请点赞、关注 ->> 你的点赞对我太有用了
群内交流更多技术
130856474 <-- 在这里