碰到一个问题,要对多语言包里的xml进行内容筛选,
进行文本内容处理,Python是个不错的选择
import sys
import os
def main():
icount = 0
fileName = sys.argv[1] + "\\resources.xml"
outName = sys.argv[1] + "\\tmp.txt"
outfile = open(outName, 'w')
infile = open(fileName, 'r')
for line in infile:
if line.find("xml version") >= 0:
outfile.write(line)
outfile.write("\n")
if line.find("resources xmln") >= 0 or line.find("") >= 0:
outfile.write(line)
infile.close()
outfile.close()
os.remove(fileName)
os.rename(outName, fileName)
main()
利用python来进行文件字符串的处理
需要注意的是,如果源文件是Linux上的文件,其换行符是0A , 在windows上执行,写入的文件中,换行符是0D 0A (\r\n)
采用二进制读写方式可以解决这个问题
outfile = open(outName, 'wb')
infile = open(fileName, 'rb')