把两种不同编码方式的文件整合放到一个utf-8的文件中

#-*- coding:utf-8 -*-
'''
Created on 2012-8-22

@author : alex
'''
try: 
    JAP=open("F:\\pythonwork\\jap.txt","r") 
    CHN=open("F:\\pythonwork\\chn.txt","r") 
    UTF=open("F:\\pythonwork\\utf.txt","w") 

#    jap_text=JAP.readline() 
#    chn_text=CHN.readline() 
    for j in JAP.readlines():
        #先decode成UTF-16,再encode成UTF-8 
        jap_text_utf8=j.decode("SHIFT_JIS").encode("UTF-8")
        UTF.write(jap_text_utf8) 
        #不转成utf-8也可以 
    for c in CHN.readlines():
        chn_text_utf8=c.decode("GB2312").encode("UTF-8") 
        #编码方式大小写都行utf-8也一样 
        UTF.write(chn_text_utf8) 
    UTF.close() 
except IOError,e: 
    print "open file error",e 
print 'write is ok'

转载于:https://my.oschina.net/marcotest/blog/74093

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值