问题背景:
今天发现离线解析html文件很多法语单词出现乱码问题,但是在sublime、vs code中查看时能够正常显示,意识到这是excel的问题
原因分析:
Excel 需要它有一个BOM头元信息来说明CSV的编码。
解决方案:
方案1⃣️:添加BOM头
方案2⃣️:pandas中将encoding改成'utf_8_sig'
# 将结果保存至文件
# csv格式,编码要用utf_8_sig,用utf_8不行
df.to_csv('earnings_trans.csv', index=False, encoding='utf_8_sig')