假设我有一个文本文件(input_文件.txt,大小约为10gb),包含以下内容
6月6日17:58:13其他字符串不唯一
6月6日17:58:13其他字符串不唯一
6月6日17:58:14其他字符串不唯一
6月6日17:58:14其他字符串不唯一
6月6日17:58:15其他字符串不唯一
6月6日17:58:15其他字符串不唯一
6月6日17:58:15其他字符串不唯一
6月6日17:58:15其他字符串不唯一
6月6日17:58:16其他字符串不唯一
6月6日17:58:16其他字符串不唯一
6月6日17:58:16其他字符串不唯一
6月6日17:58:17其他字符串不唯一
6月6日17:58:18其他字符串不唯一
6月6日17:58:19其他字符串不唯一
6月6日17:58:20其他弦不是唯一的
现在我需要编写一个Python代码,它将读取文本文件并将开始和结束之间的内容复制到另一个文件中。在
我写了下面的代码。在import re
with open(r'C:\Python27\log\master_input.txt', 'r') as infile, open(r'C:\Python27\log\output.txt', 'w') as outfile:
copy = False
for line in infile:
if re.match("Jun 6 17:58:14(.*)", line):
copy = True
elif re.match("Jun 6 17:58:16(.*)", line):
copy = False
elif copy:
outfile.write(line)
我的代码输出:(注意:我没有得到预期的输出)
6月6日17:58:14其他字符串不唯一
6月6日17:58:14其他字符串不唯一
6月6日17:58:16其他字符串不唯一
6月6日17:58:16其他字符串不唯一
6月6日17:58:16其他字符串不唯一
6月6日17:58:16其他字符串不唯一
6月6日17:58:16其他字符串不是唯一的
预期输出为:
6月6日17:58:14其他字符串不唯一
6月6日17:58:14其他字符串不唯一
6月6日17:58:15其他字符串不唯一
6月6日17:58:15其他字符串不唯一
6月6日17:58:15其他字符串不唯一
6月6日17:58:15其他字符串不唯一
6月6日17:58:16其他字符串不唯一
6月6日17:58:16其他字符串不唯一
6月6日17:58:16其他字符串不是唯一的
请在这里帮我做最好的方式…提前谢谢。在