昨天碰到了一个问题,关于python对日志处理发现出现了一个报错,最后才发现日志里面有中文:
UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 4040: illegal multibyte sequence
这个相当恶心,当时查了很多资料,最后在文档里发现了一些细节的东西,最后的解决方案:
# -*- coding: gbk -*-
import codecs
fileHandler = open('test.txt', mode='r', encoding='UTF-8')
report_lines = fileHandler.readlines()
for line in report_lines:
log=line.rstrip()
print(log)这样就可以正常输出(PS:这个是3的语法如果需要用2请自己修改下)
本文介绍了解决Python处理含有中文的日志时出现的UnicodeDecodeError错误的方法。通过使用正确的文件读取编码方式,成功避免了因中文字符引起的异常,并提供了一段示例代码。
3148





