awk是Linux自带的文件内容筛选工具,awk可以对文件内容进行切片输出,提取出我们想要的内容。
awk使用格式:awk [option] ‘条件{print ${num}}’ 。
现在我想将上图所示的.gtf文件中的第一、四、五、十列提出出来,要求第三列的值必须为“transcript”,可以通过awk命令实现。
cat Female.merge.gtf | awk '$3=="transcript"{printf $1 "\t" $4 "\t" $5 "\t" $10"\n" }'> Tden_female.bed
结果如图所示