成功解决:UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0x80 in position 109130: invalid start byte
data = pd.read_csv(
'D:/Master/Dataset/2009_skill_builder_data_corrected/skill_builder_data_corrected.csv',encoding = 'utf-8',
usecols=['order_id', 'user_id', 'skill_id', 'correct']
).dropna(subset=['skill_id'])
在网上也搜了一些,其实还是要打开的文件的编码形式不是utf-8的形式。
我是把相对应的文件转换成utf-8的编码形式。
用记事本打开文件,将文本另存为一个新文件,在保存的时候把编码形式换成‘utf-8’
之后就可以了,非常简单的一种形式。