今天在用pandas进行读取时出现了bug
出现这种情况的原因是:文件的编码不是 UTF8 编码的,而pandas读取文件时固定采用 UTF8 解码。解决方法是改为对应的解码方式。
解决的方式有两种:
第一种:
可以查看你对应文件的编码格式,使用notepad查看文件的编码格式,如果你知道了你的文件编码格式,那么你就用对应编码格式打开,如我下面的做法。
data = pd.read_table('data.txt',encoding='utf-16')
第二种:
如果不知道文件编码格式也没关系,可以自己重新设置文件