在Windows 下,进行utf-8 格式的相关转换时需要注意,许多编译器默认windows上的是ANSI编码的而非utf-8格式,这会导致绝大多数情况下BOM会丢失
因此在windows下进行转换时,要写清楚,比如我有一个gbk格式的csv文件,需要按照如下方式进行转换
import pandas as pd
df = pd.read_csv(path,encoding="gbk")
df.to_csv(path,encoding="utf-8-sig")
如果to_csv 里面直接写encoding=“utf-8” 转出来的结果会有乱码