我的数据集是这样的:
有很多中文,当你用pandas导入数据的时候容易报错
>>>data = pd.read_csv("C:/Desktop/watermelon3_0_Ch.csv")
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd4 in position 2: invalid continuation byte
设置成如下代码以后能正常显示:
data = pd.read_csv("C:/Desktop/watermelon3_0_Ch.csv",encoding = 'gbk')
加了一个encoding = ‘gbk’
这好像是windows下中文的编码