本文档总结了python2->3升级过程中遇到的编码问题
1.UnicodeDecodeError:“ascii” codec cannot decode byte oxe6 in position 501:ordinal not in range
定位:从报错日志可以发现代码运行到with open(a.txt, "r")as f:时报错,即读取文件时出错。
分析:with open 方法参数encoding没有写则默认为ascii,查看磁盘上的文件编码格式为utf8。故导致指定的ascii不能打开utf8编码的文件,ascii不能完全匹配utf8的字符集。
解决:with open(a.txt, "r")as f:改为with open(a.txt, "r", encoding="uft8")as f:
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
2.UnicodeDecodeError:“utf8” codec cannot decode byte oxa3 in position 25:invalid start byte
定位:报错日志指向with open(b.txt, "r", encoding="uft8")as f:
分析:磁盘上b.txt是utf8的编码格式,encodeing也指定了,但oxa3(utf8编码)是一个无效的字节,在文本模式(“r”)读取时无法解码为unicode编码格式。
解决:
方法1.删除b.txt里面的中文。
方法2.r->rb,以二进制形式读取,byte->byte,不会出现byte->str的解码报错信息。