Python之查询两个TXT文档把B文档出现包含A文档的词提取显示。

# -*- coding: UTF-8 -*-
import re
fo = open("2.txt", "r");
co = open("n3.txt", "r");

colines = co.readlines();
for line in fo.readlines():
    line = line.strip();
    matchObj = re.search( line, "%s" %  colines, re.M | re.I);
    
    if matchObj:
        print(line);
        
fo.close();
co.close();

在CSDN某大佬博客中抄的,具体源头找不到了,给这位大佬说声对不起。

with open("bt.txt", "rb")as f:
    source = f.readlines()
sourceSt = b"".join(source)

data = open("ne.txt", "w+");         
  
with open("2.txt", "rb") as f:
    for key in f:
        key = key.strip()
        if key in sourceSt:
             print(key.decode("gbk"),file=data) 
             
data.close()

找到重复词并输出到TXT文档。
在CSDN提问得到的一篇代码,特别鸣谢NotBack,在我不要脸的追问下修改多次代码

import re
 
 
with open("n1.txt", "rb")as f:
    source = f.readlines()
sourceSt = b"".join(source)
 
with open("2.txt", "rb") as f:
    for key in f:
        key = key.strip()
        try:
            mObj = re.search(key, sourceSt,re.M|re.I)
        except Exception:
            print(f"error key:{key.decode('gbk')}")
 
        if mObj:
            print(key.decode("gbk"))

可以过滤掉代码中KEY错误。不报错继续运行。

以上代码具体可解决,两篇文档中,重复数据的输出显示。
例:
A.txt包含
罗布
宝马
奔驰
西红柿
西瓜
B.txt包含
我有一个西瓜
我有一辆宝马
我有很多西红柿

输出:西瓜,宝马,西红柿。

再次感谢大佬们抽出时间解答问题。

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值