背景:想模拟实验一下文本情感分析,下载完语料,因为语料是一个评论一条,所以需要将所有评论整合到一个文件中,在读取每个文件时,出现了编码的问题,如下
问题:UnicodeDecodeError: 'utf8' codec can't decode byte 0xb1 in position 0: invalid start byte
大概错误意思: unicode解码错误:无法解码成‘utf-8’,在位置0处有非法的开始字节
原始代码: