awk是一个比较棒的数据处理工具,相比于sed工具主要作为行的处理,而awk更有利于对列的处理。因此,awk很适合处理小型的数据!
例如,自己想提取下面文件的染色体编号、起始位置、终止位置,不需要提取基因id那一列
运行下列代码:
head -10|awk '{print $1,$3,$4}' ruf_four3.gff > new_ruf.gff
head new_ruf.gff
结果如下图所示,文件提取了自己所需的3列
注意:awk后续的所有动作均是以单引号‘’括住的,但是如果想在awk中以打印某个特殊内容时,需要利用双引号将这部分内容定义出来,因为单引号已经是awk的命令固定用法了!