python3报错解决办法:UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 199: illegal multib

<pre name="code" class="python">        wordList = textParse(open('email/ham/%d.txt' % i).read())


 

在python3中读取文件时报错:UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 199: illegal multibyte sequence

网上各种资料大都显示是文件编码问题,所以就把utf-8,gbk,asicc等各种编码方式都试了一遍,还是没有解决问题。

然后仔细看报错信息,根据decode byte 0xae in position 199看出来好像是文件中某个字节不能解码,问题出来了,文件中包含了非法字符。

打开文件一看,第二行中夹杂着“�”字符,这个字符本来是个普通问好“?”不知道什么原因放入eclipse后就变了,删除之后,一切就正常啦。

  • 12
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 22
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 22
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值