python实现过滤文件中不需要的数据

import re

#打开文档
file_open = open(r"d:\测试文件\对比文件1.txt","r",encoding='utf-8')
file_open2 = open(r"d:\测试文件\被过滤数据的文件.txt","r",encoding='utf-8')

s = file_open.read().splitlines()
ss = file_open2.read()
ss_list = ss.splitlines()
print(ss_list)
result = []
for i in s:
#用正则表达式去匹配
    regular = "([0-9A-Za-z,]*{0}[0-9A-Za-z,]*)".format(i)
    result1 = re.findall(regular,ss)
    result = result + result1
#方法1:用需过滤的文件数据list减去过滤数据的list
# result_2 = list(set(ss_list) - set(result))
#测试结果写入文件中
file = open(r"d:\测试文件\结果.txt",'w')
# for j in result_2:
#     file.write(j + '\n')
#方法2:if条件判断
for j in ss_list:
    if j not in result:
        file.write(j+'\n')


file_open.close()
file_open2.close()
file.close()



应用场景:
比如测试过程中需要过滤文件中对应某表的数据,将表中的字段数据提取出来放入文件中,再执行脚本,可直接过滤掉数据,只需修改正则表达式可过滤对应不同的数据

比如:
对比文件1中的一行数据是A,而被过滤数据的文件中的一行数据是包含A的数据。目的是过滤掉文件中包含A的数据。

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值