python2 读写文件(txt,csv)乱码解决

中文乱码一直是程序处理中不可避免的问题,既然绕不过就想办法解决它!

通俗逻辑:

  1. 源文件编码格式,'ascii,utf-8,gbk';
  2. python读取格式设置,encoding=‘utf-8’;
  3. 在程序处理中通过encode(‘utf-8’),decode(‘utf-8’),或者u''.join();
  4. 文件输出(txt,excel,csv等)编码设置;

当然,我们还会用到,# -*-coding:utf-8 -*- 在第一,二行进行标识。

但是我们还是会遇到问题,比如说,中文输出时遇到乱码(一万个那啥啊.......)没办法,只能找解决办法。

  • 遇到问题:
    • 读取txt,经过处理,输出csv,csv遇到乱码。
  • 解决办法:
df.to_csv("data.csv",encoding="utf_8_sig") # 直接利用"utf_8_sig",才能在excel中显示中文

 

  •  解决思路:见下表
  •  
  • 171021_2cDJ_1462678.png171107_qJZY_1462678.png
  • 171128_Jk9g_1462678.png
  • 总结:

     0. 开源的编辑器实在是恶心的要死

  1. 考虑到很多时候我们需要对数据处理结果进行进一步操作,统一起见,应该将整个过程用utf-8进行规范化
  2. 总的来说:就中文处理来说。
    1. 原始数据txt尽量使用无bom格式进行存储。
    2. Excel数据输出时候,编码格式用GBK或UTF-8-SIG

转载于:https://my.oschina.net/u/1462678/blog/916489

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值