读取文件,并解析内容,但是有些文件的格式不是utf-8,导致读取失败,无法继续
原来的代码
fr = open('test.txt')
for line in fr.readlines:
print('buf:' + line)
此时如果test.txt不是utf-8格式就好报错。
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa8 in position
解决方法
import codecs
fr = open('test.txt')
改为如下即可解决问题:
fr= codecs.open('test.txt', 'r',encoding= u'utf-8',errors='ignore')