python2.7 查找替换文件中的中文

Python中默认的编码格式是 ASCII 格式,在没修改编码格式时无法正确打印汉字,所以在读取中文时会报错。

解决方法为只要在文件开头加入 # -- coding: UTF-8 -- 或者 #coding=utf-8 就行了

注意:#coding=utf-8 的 = 号两边不要空格。

Python3.X 源码文件默认使用utf-8编码,所以可以正常解析中文,无需指定 UTF-8 编码。

另外:
批量查找替换文件中的中文

#中文前加u,表示unicode格式
old_str=u"百老汇影城"
name=u"四川太平洋"
print '模板中的字符串:',old_str

def test():
    cinemaNamePath='./../dist/pages/login/agreement/agreement.wxml'

    fileName = './agreement22222.wxml'

    f = file(cinemaNamePath)

    output = open(fileName, "w")

    for line in f:
	# 将line 解码成unicode 
        line = unicode(line,"utf-8")
        #在unicode中找unicode
        if line.find(old_str) > 0:
            print '找到了 字符串 %s',old_str
            line = line.replace(old_str, name)
            print '替换后的line = ',line
            #把替换后的line,写入到新文件。  将unicode编码成字符串,通过指定的编码(utf-8)
            output.write(line.encode('utf-8'))
        #print 'line = ',line    
    f.close()
    output.close()
#调用 test方法
test()

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值