关闭

去除文件中的重复元素后写入文件

997人阅读 评论(0) 收藏 举报
分类:

去除文件中的重复元素后写入文件


#coding:utf-8
import fileinput
import re

#只包含单行的数据文件
f=open(r'D:\snowDocument\excludes.txt','w')

#匹配行内容中包含 '-'的字符
p2=re.compile('-')

def main():
    l=[]
    for line in fileinput.input(r'D:\snowDocument\original.txt'):
        if re.search(p2,line) :
            line = line.split()[0].split('-')[1]

            line = line.replace('(','')
            line =line.replace(')','')
            print line.decode('utf-8')
            l.append(line)
##            line.replace('|')
##    print len(l)

    #使用集合去除列表中的重复元素后写入文件
    l=set(l)

    f.write('|'.join(l))

    f.close()


if __name__ == '__main__':
    main()


0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:1036171次
    • 积分:9106
    • 等级:
    • 排名:第2121名
    • 原创:189篇
    • 转载:202篇
    • 译文:1篇
    • 评论:47条
    文章分类
    最新评论