我有一个制表符分隔文件,看起来像这样
chr1 12226559 12227059 TNFRSF1B
chr1 17051560 17052060
chr1 17053279 17053779
chr1 17338423 17338923 ATP13A2
ATP13A2
ATP13A2
chr1 19577574 19578074 EMC1
MRTO4
chr1 19578046 19578546 EMC1
MRTO4
chr1 19638239 19638739 AKR7A2
PQLC2
PQLC2
PQLC2
AKR7A2
PQLC2
我希望删除重复column4值的行.
前三列是坐标,在那些坐标中列出了我们发现的任何内容(在第4栏中),并且对于每个坐标,我希望只有唯一的名称而不是名称的重复.
我想要这样的输出
chr1 12226559 12227059 TNFRSF1B
chr1 17051560 17052060
chr1 17053279 17053779
chr1 17338423 17338923 ATP13A2
chr1 19577574 19578074 EMC1
MRTO4
chr1 19578046 19578546 EMC1
MRTO4
chr1 19638239 19638739 AKR7A2
PQLC2
我尝试过的事情
sort -k 4 -u file
awk '{if($4==temp1){next;}else{print}temp1=$4}' file
什么都行不通:(
请帮忙
谢谢