用python转换不同编码的文本文件

这本来应该是一个很简单的问题,一开始被我想复杂了。弄得绕了很大一个圈。

先说事例:

得到一个big5编码的文本文件,用记事本打开显示为乱码,想转换保存为UTF-8或gb-2312编码文档,就这么回事!

开始以为要用到encode()和decode()进行内码转换后再保存,结果py总是报错……后来发现:在Python3.x以后,f.read()的文本内容都自动转换为Unicode,文本文档保存为哪种编码,由打开文件的encoding参数决定。因此,将big5编码的文件(本例:big5.txt)转存为UTF-8编码的文件(本例:UTF8.txt),只需如下操作:

bg=open('big5.txt','r',encoding='big5')

ut=open('utf8.txt','w',encoding='utf-8')

ut.write(bg.read())

bg.close()

ut.close()

 

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值