从博客园或其它地方拷贝代码,经常前面有代码序号,像下面这个样子:
1 wbContent.Navigate(vURL);
2
3 Result:=GetHtml(wbContent);
4
5 while not ContainsText(Result,'共找到') do
6 begin
7 Sleep(100);
8 Application.ProcessMessages;
9 Result:=GetHtml(wbContent);
10 end;
11
12 Result:=GetHtml(wbContent);
可以使用Python的正则表达式来简单地去掉前面的序号:
import re,sys
def refile():
# sf='e:\\temp\\t.txt'
# df='e:\\temp\\t_new.txt'
# 命令行输入
argvc=len(sys.argv)
if argvc==1:
sf=input( ' 请输入要转换的原文件名: ')
df=input( ' 请输入要转换的目标文件名: ')
if argvc==2:
sf=sys.argv[1]
df=input( ' 请输入要转换的目标文件名: ')
if argvc==3:
sf=sys.argv[1]
df=sys.argv[2]
fr=open(sf, ' r ')
fw=open(df, ' w ')
pat=re.compile( ' \A(\s\d)|(\d{1,3}) ')
s=fr.readline()
while s:
m=pat.match(s)
s=fr.readline()
if m:
ss=re.sub(pat, '', s)
else:
ss=s
fw.write(ss+ ' \n ')
fr.close()
fw.close()
if __name__ == ' __main__ ':
refile()
def refile():
# sf='e:\\temp\\t.txt'
# df='e:\\temp\\t_new.txt'
# 命令行输入
argvc=len(sys.argv)
if argvc==1:
sf=input( ' 请输入要转换的原文件名: ')
df=input( ' 请输入要转换的目标文件名: ')
if argvc==2:
sf=sys.argv[1]
df=input( ' 请输入要转换的目标文件名: ')
if argvc==3:
sf=sys.argv[1]
df=sys.argv[2]
fr=open(sf, ' r ')
fw=open(df, ' w ')
pat=re.compile( ' \A(\s\d)|(\d{1,3}) ')
s=fr.readline()
while s:
m=pat.match(s)
s=fr.readline()
if m:
ss=re.sub(pat, '', s)
else:
ss=s
fw.write(ss+ ' \n ')
fr.close()
fw.close()
if __name__ == ' __main__ ':
refile()
上面只是简单示例,将拷贝出来的源码存为t.txt,然后运行程序,则会生成t_new.txt文件。