【linux基础】指定分隔符分割文件 cut 、awk(指定多个分隔符分割文件提取列,如提取注释文件gff3内的基因ID)

1. cut 

-d  指定分隔符

cut -d , -f 1 1.txt > d1.txt

2. awk   ## 同时指定多个分割符

-F 指定分隔符
awk -F ',' '{print $1}' d1.txt

如果指定多个分隔符,使用中括号 [] https://www.cnblogs.com/liujiaxin2018/p/16508279.html

awk -F "[\t :=;]" '{print $1,$4,$5,$11,$13}' 11.txt

示例:如果你想从GFF3里提取出基因怎么做?

如:你想提取QTL区间的基因,那你得先准备一个参考基因组上基因ID 、基因Name、起始、终止的文件。

1.原始GFF3

 2. 思路:先提取第三列是基因---再提取有Name 的基因--再分隔

grep -v '#' Sus_scrofa.Sscrofa11.1.99.gff3 |awk '$3=="gene"'|grep 'Name'|awk -F "[\t :=;]" '{print $1,$4,$5,$11,$13}'|less -S

匹配也可以借助   awk    '/Name/'  file.txt

最终结果如下:

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值