Chardet:通用字符编码检测器

        你是否在为下图中的报错所烦恼?烦恼文件的编码格式是什么?一遍又一遍的尝试,换来的只有冰冷的报错,今天我们将用Chardet一雪前耻。

        Chardet是 Mozilla 中自动检测代码的端口。作者试图尽可能多地维护原始结构(主要是出于自私的原因,以便随着原始代码的发展更容易维护端口)。由于作者的贡献,我们可以简单快速的使用到这个库。

快速开始

1. 安装库

            pip install chardet

2. 检测文件格式(非常简单!!!)

# 代码
import chardet

with open("b.txt", "rb") as f:
    print(chardet.detect(f.read()))

         我们可以看到原来编码格式是UTF-16,难怪运行不了。运行结果分析:encoding就是文件的编码格式;confidence就是认为是UTF-16的置信度,1.0代表100%是UTF-16;language就不知道是什么,了解的小伙伴评论区说一下的。

result:
{'encoding': 'UTF-16', 'confidence': 1.0, 'language': ''}

结尾

接下来也会持续分享一些简单好用并且提供日常写代码效率的库,如果感兴趣不妨关注一下!!!

如果觉得文章对你有用请点赞、关注  ->> 你的点赞对我太有用了
群内交流更多技术
130856474  <--  在这里

  • 9
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值