Python报错:
UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xb9 in position 0: invalid start byte
问题描述
运行python代码时出现报错:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb9 in position 0: invalid start byte
是因为我在训练中调用了本地文件neg.txt pos.txt
from snownlp import sentiment
sentiment.train('./neg.txt', './pos.txt')
sentiment.save('sentiment.marshal')
解决方案:
这是由于要读取某个自己的文件,然后这个文件的编码不是utf8,把文本文件编码改为utf8就可以了