Python之查询两个TXT文档把B文档出现包含A文档的词提取显示。

最新推荐文章于 2022-05-09 20:45:01 发布

穿袜子的猫和穿靴子的狗

最新推荐文章于 2022-05-09 20:45:01 发布

阅读量489

点赞数 1

分类专栏： Python代码文章标签： Python代码

本文链接：https://blog.csdn.net/zhichun93118/article/details/90413522

版权

Python代码专栏收录该内容

1 篇文章 0 订阅

订阅专栏

# -*- coding: UTF-8 -*-
import re
fo = open("2.txt", "r");
co = open("n3.txt", "r");

colines = co.readlines();
for line in fo.readlines():
    line = line.strip();
    matchObj = re.search( line, "%s" %  colines, re.M | re.I);
    
    if matchObj:
        print(line);
        
fo.close();
co.close();

在CSDN某大佬博客中抄的，具体源头找不到了，给这位大佬说声对不起。

with open("bt.txt", "rb")as f:
    source = f.readlines()
sourceSt = b"".join(source)

data = open("ne.txt", "w+");         
  
with open("2.txt", "rb") as f:
    for key in f:
        key = key.strip()
        if key in sourceSt:
             print(key.decode("gbk"),file=data) 
             
data.close()

找到重复词并输出到TXT文档。
在CSDN提问得到的一篇代码，特别鸣谢NotBack，在我不要脸的追问下修改多次代码

import re
 
 
with open("n1.txt", "rb")as f:
    source = f.readlines()
sourceSt = b"".join(source)
 
with open("2.txt", "rb") as f:
    for key in f:
        key = key.strip()
        try:
            mObj = re.search(key, sourceSt,re.M|re.I)
        except Exception:
            print(f"error key:{key.decode('gbk')}")
 
        if mObj:
            print(key.decode("gbk"))

可以过滤掉代码中KEY错误。不报错继续运行。

以上代码具体可解决，两篇文档中，重复数据的输出显示。
例：
A.txt包含
罗布
宝马
奔驰
西红柿
西瓜
B.txt包含
我有一个西瓜
我有一辆宝马
我有很多西红柿

输出：西瓜，宝马，西红柿。

再次感谢大佬们抽出时间解答问题。

穿袜子的猫和穿靴子的狗

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Python之查询两个TXT文档把B文档出现包含A文档的词提取显示。

# -*- coding: UTF-8 -*-import refo = open("2.txt", "r");co = open("n3.txt", "r");colines = co.readlines();for line in fo.readlines(): line = line.strip(); matchObj = re.search( line, "%s...
复制链接

扫一扫