python实现过滤文件中不需要的数据

最新推荐文章于 2022-12-24 12:57:48 发布

thea2020

最新推荐文章于 2022-12-24 12:57:48 发布

阅读量1.7k

点赞数

本文链接：https://blog.csdn.net/Theahe/article/details/108129015

版权

import re

#打开文档
file_open = open(r"d:\测试文件\对比文件1.txt","r",encoding='utf-8')
file_open2 = open(r"d:\测试文件\被过滤数据的文件.txt","r",encoding='utf-8')

s = file_open.read().splitlines()
ss = file_open2.read()
ss_list = ss.splitlines()
print(ss_list)
result = []
for i in s:
#用正则表达式去匹配
    regular = "([0-9A-Za-z,]*{0}[0-9A-Za-z,]*)".format(i)
    result1 = re.findall(regular,ss)
    result = result + result1
#方法1:用需过滤的文件数据list减去过滤数据的list
# result_2 = list(set(ss_list) - set(result))
#测试结果写入文件中
file = open(r"d:\测试文件\结果.txt",'w')
# for j in result_2:
#     file.write(j + '\n')
#方法2：if条件判断
for j in ss_list:
    if j not in result:
        file.write(j+'\n')


file_open.close()
file_open2.close()
file.close()