文件处理,要求第一列相同的行只保留最后出现的一行。
100001 I
100001 U
100001 D
200001 I
300000 U
200001 D
300000 D
400000 I
400000 U
处理完之后的样子为:
100001 D
200001 D
300000 D
400000 U
awk '{a[$1]=$0}END{for(i in a)print a[i]}' d | sort|column -t
解析:
a[$1]=$0,因为$1会出现好多次,即第一列相同的行会出现好多次,所以我们将$0的值给他,如果后面再出现的话,a[$1]的内容就会被覆盖。所以数组里面的内容就是保存的最后出现的一次的值。最后将数组中的内容就行输出就好了。