# -*- coding: UTF-8 -*-
import re
fo = open("2.txt", "r");
co = open("n3.txt", "r");
colines = co.readlines();
for line in fo.readlines():
line = line.strip();
matchObj = re.search( line, "%s" % colines, re.M | re.I);
if matchObj:
print(line);
fo.close();
co.close();
在CSDN某大佬博客中抄的,具体源头找不到了,给这位大佬说声对不起。
with open("bt.txt", "rb")as f:
source = f.readlines()
sourceSt = b"".join(source)
data = open("ne.txt", "w+");
with open("2.txt", "rb") as f:
for key in f:
key = key.strip()
if key in sourceSt:
print(key.decode("gbk"),file=data)
data.close()
找到重复词并输出到TXT文档。
在CSDN提问得到的一篇代码,特别鸣谢NotBack,在我不要脸的追问下修改多次代码
import re
with open("n1.txt", "rb")as f:
source = f.readlines()
sourceSt = b"".join(source)
with open("2.txt", "rb") as f:
for key in f:
key = key.strip()
try:
mObj = re.search(key, sourceSt,re.M|re.I)
except Exception:
print(f"error key:{key.decode('gbk')}")
if mObj:
print(key.decode("gbk"))
可以过滤掉代码中KEY错误。不报错继续运行。
以上代码具体可解决,两篇文档中,重复数据的输出显示。
例:
A.txt包含
罗布
宝马
奔驰
西红柿
西瓜
B.txt包含
我有一个西瓜
我有一辆宝马
我有很多西红柿
输出:西瓜,宝马,西红柿。
再次感谢大佬们抽出时间解答问题。