想把一堆文件合成一个大文件,但是里面有好多无法识别的字符,每次执行总是抱错,最后找到了codecs的ignore相当好用
import os
import codecs
#遇到非法字符时,不报错,直接写入后继续执行
wFile = codecs.open("d:\\output.log","w","utf-8","ignore")
for file in os.listdir("d\\input\\") :
#遇到非法字符时,不报错,直接读入后继续执行
rFile = codecs.open("d\\input\\" + file,'r',"utf-8",'ignore')
#写入文件名
wFile.write(file)
#写入文件内容
wFile.writelines(rFile.readlines())
rFile.close()
wFile.close