excel查看编码格式_利用python查询文件编码

点击上方“Python日记本

未来有大量项目实操和自动化办公,欢迎关注!

     bb3a0eb7b7f50b78e0e997820249e376.png        

最近,在处理一些csv和excel格式文件

在读取中文的情况下,通常会遇到一些编码的问题

传统方法都是尝试用utf-8和gbk打开

然后都打不开(如以下两图)

       f80c33e6f186217800dc4ec03d8e4777.png             f0d242dc98a30079c3a357e4e38be556.png       

上网翻阅了资料,见到推荐说多尝试其他文字编码

比如说GB2312编码、GB18030编码,但都不可以打开

我当时就想,与其猜灯谜般尝试这么多编码,不如看看有没有方法直接知道这个文件是什么编码

在搜索引擎的结果中,推荐了chardet库来查看编码方式的。

import chardet
#打开其中一个csv文件,查看其编码格式
f = open('\\Users\\a\\Desktop\\428.csv','rb')
data = f.read()
print(chardet.detect(data))

把文件解释成二进制,再调用chardet模块的detect方法读取这个文件数据就知道这个文件是用什么编码了。

ad58398e4c9145f220a883d3eb5025e5.png

可以看到,这个文件是用utf-16编码格式的

用utf-16编码,就能打开这个csv文件了

   相关阅读   请求头快速加引号和用逗号隔开 自动化办公 | docx模块简要介绍Python怎么实现营销号生成器功能?

(对文章有疑问或者有建议,可以在后台加微信聊聊哦!)

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值