最近需要对fasta文件的id进行处理,输入的ID格式如下:
而我要处理成:
也就是过滤文件的最后一列,目前过滤文件的最后一列的方法有如下:
(1) awk '{print $1"\t"$2"\t"$3"\t"$4"\t"$5}'
解析:因为该文件有六列,过滤最后一列也就是只打印前五列,但是存在的问题是:awk打印出来的第一列和第二列之间的空格数对应不起来
(2) awk '{$NF=""; print}'
解析: 这样做只是把最后一列,替换成空格,而第5列和第6列之间仍然存在空格,其替换过程可以表示成:$5\t$6\n -> $5\t\n,其生产的结果对比如下图:
其中mody1.id为上述awk的处理结果,mody2.id为用vim打开之后,手动删除的最后一列的结果
(3) awk 'NF{NF--}1'
解析:这种方法就能得到和mody2.id一样的结果,但是NF{NF--}后面的1代表什么意思?