samtools faidx输出的fai文件格式解析 | fasta转bed | fasta to bed

fai示例:

Sc0000003       2774837 10024730        60      61
Sc0000004       2768176 12845826        60      61
Sc0000005       2756750 15660150        60      61
Sc0000006       2627294 18462857        60      61
Sc0000007       2472379 21133951        60      61
Sc0000008       2452568 23647548        60      61

  

NAME	Name of this reference sequence
LENGTH	Total length of this reference sequence, in bases
OFFSET	Offset within the FASTA file of this sequence's first base
LINEBASES	The number of bases on each line
LINEWIDTH	The number of bytes in each line, including the newline

http://www.htslib.org/doc/faidx.html

offset比较让人费解,其实就是 bytes starting from zero,文件层次的属性,一般不需要关注。

 

有时需要将fasta转为bed,就是统计长度就好了,但是利用samtools faidx这个功能,速度奇快,再配合一行Linux命令就搞定。

awk '{print $1, 1, $2}' file | sed -e 's/ /\t/g' > out

  

 一个问题:bam,bed,gtf的位置都是从1开始的吗?

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值