Python美化文本内容

一般情况下可以通过,NotePad++中的,正则表达式替换

但是,如果想一次性替换完成的话,则写一个程序比较好

主要使用

.strip()去除空字符

如果要删除或者替换文字要使用.replace()

因为,strip是汉字的时候有时候失效,还是replace保险

i = i.replace("▲","").replace("★","").replace("●","").replace("▽","").strip()

如果是多个内容不同的单行,前后有换行符,你想把换行符替换的话,这时候是不是不能替换,

你好
我是中国
%10
人打飞机萨科
%

我使用 .seek()的方式替换掉,把输入点前移一个字符

File1.seek(-1, 1)

但是此种方法有一个bug,遇到不是汉字的单行,就会出现一个乱码,而且会改变单行的内容,就是下面这玩意

很纠结,后来我在,这种特殊单行前后加一个很少用的汉字,作为标识,让我加入的内容变成乱码也无妨,

替换之后,把乱码和自己加的内容替换掉就行,

不过后来发现,乱码是不一样的,只有在eclipse替换之后,使用eclipse打开的时候一样,我就手动用eclipse替换掉了

#coding=utf-8
#author=dubinglin
#date=2017/07/31

import re
File = open('hjtensei.corp','rb')
File1 = open('hjtensei1.corp', 'wb')
a = File.readlines()
for i in a:
    i = i.replace("▲","").replace("★","").replace("●","").replace("▽","").strip()
    if re.match("[0-9]{4}年[0-9]{2}月[0-9]{2}日",i):
        continue
    if re.match("http:",i,re.I):
        continue
    if re.match("奖励沪元",i):
        continue
    if re.match("需要回复",i):
        continue
    if len(i)<10 and File1.tell() != 0:
        File1.seek(-1, 1)
        File1.write("纛纛纛"+i+"纛纛纛")
        File1.seek(-1, 1)
    else:
        File1.write("纛纛纛"+i+"纛纛纛"+"\n")
File.close()
File1.close()
File = open('hjtensei1.corp','rb')
File1 = open('hjtensei.corp', 'wb')
a = File.readlines()
for i in a:
    i = i.replace("纛","").replace("�","") #这一行中的替换乱码没有效果
    File1.write(i)
print "替换结束"


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值