1. cut
-d 指定分隔符
cut -d , -f 1 1.txt > d1.txt
2. awk ## 同时指定多个分割符
-F 指定分隔符
awk -F ',' '{print $1}' d1.txt
如果指定多个分隔符,使用中括号 []
https://www.cnblogs.com/liujiaxin2018/p/16508279.html
awk -F "[\t :=;]" '{print $1,$4,$5,$11,$13}' 11.txt
示例:如果你想从GFF3里提取出基因怎么做?
如:你想提取QTL区间的基因,那你得先准备一个参考基因组上基因ID 、基因Name、起始、终止的文件。
1.原始GFF3
2. 思路:先提取第三列是基因---再提取有Name 的基因--再分隔
grep -v '#' Sus_scrofa.Sscrofa11.1.99.gff3 |awk '$3=="gene"'|grep 'Name'|awk -F "[\t :=;]" '{print $1,$4,$5,$11,$13}'|less -S
匹配也可以借助 awk '/Name/' file.txt
最终结果如下: