python文件读写编码

我们知道,在python中有一句经典名言是“decode early,unicode everywhere,encode later”表示一个字符串建议先全部decode为unicode编码,然后根据所需encode为目标编码。那么对字符串的处理基本没什么问题了。
但是涉及到写文件时的编码问题现在在下面总结一下:

#coding:utf-8
f = open('file.txt', 'wb') #以二进制方式打开文件
f.write('写入中文')   # 这样写入后notepad++打开时文件编码是ANSI
f.close()

如果数据是unicode,先编码再写入:

#coding:utf-8
f = open('file.txt', 'wb') 
f.write(u'写入中文'.encode('utf-8') # 这样写入后notepad++打开时文件编码是utf-8
f.close()

用codecs模块的话,通常的情况是你要写入的数据就是unicode string,不需要再decode了。

#coding:utf-8
import codecs    #这个模块可以实现。
s = u'中文;123'       # s是unicode string
f = codecs.open('ufile.log', 'w', 'utf-8')
f.write(s)  #直接写入,codecs负责编码,文件编码为utf-8
f.close()

相信上面的代码已经能解决对文件编码的读写问题(把w改成r就是读),其中强烈建议最上面的#coding:utf-8加上(详情查PEP0263看https://www.python.org/dev/peps/pep-0263/)。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值