python删除重复值所在的行数_python – 在last中删除具有重复值的行

我有一个制表符分隔文件,看起来像这样

chr1 12226559 12227059 TNFRSF1B

chr1 17051560 17052060

chr1 17053279 17053779

chr1 17338423 17338923 ATP13A2

ATP13A2

ATP13A2

chr1 19577574 19578074 EMC1

MRTO4

chr1 19578046 19578546 EMC1

MRTO4

chr1 19638239 19638739 AKR7A2

PQLC2

PQLC2

PQLC2

AKR7A2

PQLC2

我希望删除重复column4值的行.

前三列是坐标,在那些坐标中列出了我们发现的任何内容(在第4栏中),并且对于每个坐标,我希望只有唯一的名称而不是名称的重复.

我想要这样的输出

chr1 12226559 12227059 TNFRSF1B

chr1 17051560 17052060

chr1 17053279 17053779

chr1 17338423 17338923 ATP13A2

chr1 19577574 19578074 EMC1

MRTO4

chr1 19578046 19578546 EMC1

MRTO4

chr1 19638239 19638739 AKR7A2

PQLC2

我尝试过的事情

sort -k 4 -u file

awk '{if($4==temp1){next;}else{print}temp1=$4}' file

什么都行不通:(

请帮忙

谢谢

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值