问题描述
在使用pandas的read_csv读取csv文件时会报读取的错误
- 读取代码
import pandas as pd
file_content = pd.read_csv(“文件名”, encoding='utf-8')
print(file_content)
- 报错信息be like:
'utf-8' codec can't decode byte 0xca in position 184776: invalid continuation byte
UnicodeDecodeError: 'gbk' codec can't decode byte 0xca in position 184776: illegal multibyte sequence
解决方法
更换编码格式!!!
可尝试的编码格式
utf-8, gbk, gb2312, gb18030, ISO-8859-1, ansi,latin
总有一个合适。
最后我是使用 ISO-8859-1
这个编码通过的
参考博客
原理请参考:https://blog.csdn.net/qq_37383582/article/details/115422308
编码格式参考:https://blog.51cto.com/u_16099242/6483312