多个文本文件两两碰撞相同内容

# -*- coding: cp936 -*-
import os,sys,glob,itertools
os.chdir(sys.path[0])

def getsame(a,b):
    la=[]
    lb=[]
    for i in open(a):
        la.append(i.strip())
    for i in open(b):
        lb.append(i.strip())
        
    ret =  list(set(la).intersection(set(lb)))  
    if len(ret)==0:
        return a[:-4]+'-'+b[:-4]+' : 匹配个数 0'
    else:
        return a[:-4]+'-'+b[:-4]+'  : 匹配个数 '+str(len(ret))+'\r\n'+' '.join(ret)+'\r\n'


fn=[]
for i in glob.glob('*.txt'):
    fn.append(i)


for a,b in itertools.combinations(fn,2):
    print getsame(a,b)
    
    

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值