在写入CSV文件时,如果含有中文字符,再次读取该csv文件时则会发生编码错误。
例如:
data.to_csv("test.csv", index=False, sep=',')
readed_data = pd.read_csv("test.csv")
data是一个DataFrame对象。
如果像上述代码那样写,读取文件时会报错。
改正为:
data.to_csv("test.csv", index=False, sep=',', encoding='utf-8')
只要在写入csv文件时,自己明确规定好字符编码规则,读取时就不会发生中文字符的编码错误。一般使用utf-8编码。