根本原因:解码方式错误
由于有的文件编码格式特殊,在进行 read_csv 时会出现报错信息,因为其默认的编码方式为 UTF-8 ,有的文件不支持此编码格式则会报错:
'utf-8' codec can't decode byte 0xb2 in position 0: invalid start byte
在读取文件时,只需要更改其编码格式即可: 更改为:encoding = ‘编码格式’
read_csv(filename, encoding ='utf-8')
常见的编码格式:
0. UFT-8
1. gb2312
2. gb18030
3. GBK
4. ISO-8859-1