这是我自己遇到的中文字符的情况,报错信息类似于:
UnicodeDecodeError: ‘utf8’ codec can’t decode byte 0xd1 in position 0: invalid continuation byte
最终解决的方案如下
Just using ‘rb’ and decode(‘utf8’,‘ignore’)
比如说要打开一个文件 file.txt,其中的英文字符中还混杂了中文日文等字符,在读写时可以这样做:
with open('path/file.txt','rb') as f:
lines = f.readlines()
for line in lines:
content = line.decode('utf8','ignore')
这样就OK了,是不是很简单!