python 修改文件编码_利用python查询文件编码

点击上方“Python日记本

未来有大量项目实操和自动化办公,欢迎关注!

     99d6a063f692fd52d9cd9cae9ba0dc8e.png        

最近,在处理一些csv和excel格式文件

在读取中文的情况下,通常会遇到一些编码的问题

传统方法都是尝试用utf-8和gbk打开

然后都打不开(如以下两图)

       e8b37b6008d00f364a977810f413861f.png             008f642bbf4585ba08f79a4015a9ce12.png       

上网翻阅了资料,见到推荐说多尝试其他文字编码

比如说GB2312编码、GB18030编码,但都不可以打开

我当时就想,与其猜灯谜般尝试这么多编码,不如看看有没有方法直接知道这个文件是什么编码

在搜索引擎的结果中,推荐了chardet库来查看编码方式的。

import chardet
#打开其中一个csv文件,查看其编码格式
f = open('\\Users\\a\\Desktop\\428.csv','rb')
data = f.read()
print(chardet.detect(data))

把文件解释成二进制,再调用chardet模块的detect方法读取这个文件数据就知道这个文件是用什么编码了。

c06df97dfbaa01e8767cbbd9d65e151c.png

可以看到,这个文件是用utf-16编码格式的

用utf-16编码,就能打开这个csv文件了

   相关阅读   请求头快速加引号和用逗号隔开 自动化办公 | docx模块简要介绍Python怎么实现营销号生成器功能?

(对文章有疑问或者有建议,可以在后台加微信聊聊哦!)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值