python去重txt文本_python中实现两个txt文档的去重功能(即去掉第一个文档中和第二文档相同的行)...

例如:1.txt文档为(全是字符串类型):abcde00dldf4dkfdf00djfj6dkkdf12djkf5dffdh12dkff6dkdfo2.txt文档为(全是字符串类型):abcde00dldf4dkfdf12dkff6dkdfo现在要实现从1.txt中去...

例如:

1.txt文档为(全是字符串类型):

a b c d e

00 dldf 4 dkf df

00 djfj 6 dkk df

12 djkf 5 dff dh

12 dkff 6 dkd fo

2.txt文档为(全是字符串类型):

a b c d e

00 dldf 4 dkf df

12 dkff 6 dkd fo

现在要实现从1.txt中去除与2.txt文档相同的行(标题行不变),得到另一3.txt文档为:

a b c d e

00 djfj 6 dkk df

12 djkf 5 dff dh

(其实是大型数据,这里只是举例)我现在用的代码是:

import sys

import os

import string

fgene1= open('1.txt','r')

fgene2= open('2.txt','r')

fgene3= open('3.txt','a+')

#读取文件首行,无需处理

str1 = fgene1.readline()

fgene3.write(str1)

for oneLine in fgene1:

str1= oneLine.split()

t=1

for PLine in fgene2:

str2= PLine.split()

if (str1==str2) :

t=0

break

if (t==1):

fgene3.write(' '.join(str1)+'\n')

fgene1.close()

fgene2.close()

fgene3.close()

语法没有出错,但是结果不对,还望各位多指点,看是哪里出现问题了,帮我改改,非常感谢!

展开

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值