python删除重复单词_[Python]python去除两个txt文件的重复词汇 python 2020.2.10

两个txt文件词汇,用换行符分隔。可以用代码将要处理的文件去掉另一个文件所包含的重复内容。

如:

a.txt内容为:

衡山

泰山

西湖

紫禁城

b.txt内容为:

泰山

衡山

长白山

张三丰

将a.txt设为要处理的文件,将b.txt设为字典,则输出的c.txt文件为

c.txt

西湖

紫禁城

代码如下:

1 importcsv2 importre3 importio4

5 #创建字典

6 defdictlist(filepath):7 dicts = [line.strip() for line in open(filepath, 'r', encoding='utf-8').readlines()]8 returndicts9

10 dicts = dictlist('E://word2.txt') #这里去重词的路径

11 f2=open("E:/word4.txt","a+",encoding='utf-8') #这里为写入的新文件

12 f=open("E:/word3.txt","r+",encoding='utf-8') #这里为要处理的文件

13 for line inf:14 if line.strip() not indicts:15 f2.write(line.strip()+"\n")16 f.close()17 f2.close()

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值