import re
#打开文档
file_open = open(r"d:\测试文件\对比文件1.txt","r",encoding='utf-8')
file_open2 = open(r"d:\测试文件\被过滤数据的文件.txt","r",encoding='utf-8')
s = file_open.read().splitlines()
ss = file_open2.read()
ss_list = ss.splitlines()
print(ss_list)
result = []
for i in s:
#用正则表达式去匹配
regular = "([0-9A-Za-z,]*{0}[0-9A-Za-z,]*)".format(i)
result1 = re.findall(regular,ss)
result = result + result1
#方法1:用需过滤的文件数据list减去过滤数据的list
# result_2 = list(set(ss_list) - set(result))
#测试结果写入文件中
file = open(r"d:\测试文件\结果.txt",'w')
# for j in result_2:
# file.write(j + '\n')
#方法2:if条件判断
for j in ss_list:
if j not in result:
file.write(j+'\n')
file_open.close()
file_open2.close()
file.close()
应用场景:
比如测试过程中需要过滤文件中对应某表的数据,将表中的字段数据提取出来放入文件中,再执行脚本,可直接过滤掉数据,只需修改正则表达式可过滤对应不同的数据
比如:
对比文件1中的一行数据是A,而被过滤数据的文件中的一行数据是包含A的数据。目的是过滤掉文件中包含A的数据。