1)当读入的文件出现“\xef\xbb\xbf”时,可以通过“utf-8-sig”解码修正。如:
line = f.readline()
line = line.decode('utf-8-sig')
2)当读入的文件出现“\ufeff”时,可以通过“utf-8”解码修正。如:
line = f.readline()
line = line.decode('utf-8')
3)当读入的中文出现乱码,如“\u4e2d\u56fd\u79fb\u52a817”的时候,可以通过“gb2312”解码修正。如:</