有时候数据会遇到一些错误包。例如,正确的数据应:
20141010,aaa,bbb,ccc,ddd,eee
但实际的数据是来:
20141010,aaa,bbb,
ccc,ddd,
eee
这样出现错误换行。在进行一些数据处理时就不能通过
解决的方法:
import re
dfile=open('tt.txt','r')
lists=[]
for line in dfile:
m=re.match('2014.+',line)
if m:
lists.append(line)
else:
lists[-1]=lists[-1].strip('\n')+line
print lists
ofile=open('ttt.txt','w')
for line in lists:
ofile.write(line)
dfile.close()
ofile.close()
使用正则表达式匹配行开头,删除换行符
版权声明:本文博主原创文章,博客,未经同意不得转载。