python读文件时UnicodeDecodeError的处理

python中通过open打开文件后,当文件中有中文fd.readline()时会抛出UnicodeDecodeError的异常。基本上可以确定是读入文件的编码问题。因为读入的文件是用VS来写的C++的代码,而vs默认保存的编码是gb2312。当将文件编码转换成UTF-8时正常。根本解决方法是将那些VS写的代码统一成UTF-8的编码,但是这部分代码不是我来维护,并且代码还在增加,其他开发人员通过VS快速的建立C++类,要求他们使用高级保存选项另存为UTF-8貌似还有写难度,只能通过自己来暂时性解决这个问题。

open函数的原型:

通过指定encoding参数来指定打开文件的编码。encoding的值默认是UTF-8,通过fd.encoding可以获得它的值。

如果需要自动获得文件的编码格式需要chardet模块支持才行。

解决方法,默认还是使用utf-8方式来读入文件,当有UnicodeDecodeError异常时,with open(fn, "r") as fd块的会自动把fd关闭,所以,直接在except中使用gbk编码重新打开文件就可以了。

  • 7
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值