python 文件去重复



1.strip() set()

def modi_File(filename):
    sFile="out/"+filename
    oFile="out1/"+filename
    fp = file(sFile,"r")
    lines = fp.readlines()
    fp.close()
    index =0
    count =len(lines)
    while index<count:
        lines[index]=lines[index].strip("\n")
        index +=1
    flines=list(set(lines))
    fp_w=file(oFile,"w")
    count=0
    for line in flines:
        fp_w.write(str(line)+"\n")
        count +=1
    fp_w.write("数据总量:%s"%count)
    fp_w.close()

2.

#!/usr/bin/python2
# coding: utf-8


def modi (filename):
    IN    = '/tmp/' + filename        # "out/" + filename
    OUT   = '/tmp/' + '_' + filename  # "out1/" + filename
    fhi   = open (IN)
    fho   = open (OUT, 'w')
    uniq  = set ()
    count = 0

    for line in fhi:
        if line in uniq: continue
        uniq.add (line)
        count += 1
        fho.write (line)

    fho.write ("数据总量:%s" % count)
    fhi.close ()
    fho.close ()


modi ('xyz')



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值