关闭

多个文本文件两两碰撞相同内容

1053人阅读 评论(0) 收藏 举报
分类:
# -*- coding: cp936 -*-
import os,sys,glob,itertools
os.chdir(sys.path[0])

def getsame(a,b):
    la=[]
    lb=[]
    for i in open(a):
        la.append(i.strip())
    for i in open(b):
        lb.append(i.strip())
        
    ret =  list(set(la).intersection(set(lb)))  
    if len(ret)==0:
        return a[:-4]+'-'+b[:-4]+' : 匹配个数 0'
    else:
        return a[:-4]+'-'+b[:-4]+'  : 匹配个数 '+str(len(ret))+'\r\n'+' '.join(ret)+'\r\n'


fn=[]
for i in glob.glob('*.txt'):
    fn.append(i)


for a,b in itertools.combinations(fn,2):
    print getsame(a,b)
    
    

0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:701879次
    • 积分:8647
    • 等级:
    • 排名:第2197名
    • 原创:188篇
    • 转载:204篇
    • 译文:1篇
    • 评论:67条
    最新评论