Bedtools中的基因组坐标

Bedtools 是一个功能强大的工具集,用于在基因组范围内执行各种操作,例如重叠检测、合并、分割、过滤等。bedtools 会按照 0-based 的半开区间(half-open interval)表示基因组坐标,这与许多其他工具(如 bowtie2、BWA 等)的表示方式不同,后者通常使用 1-based 的闭区间(closed interval)。

BED 格式是一种常见的用于描述基因组特征的文本格式,它通常由四个列组成:

  1. 染色体名称(chromosome name)
  2. 起始位置(start position)
  3. 结束位置(end position)
  4. 可选的额外信息,如基因名称、得分等(optional additional information, such as gene name, score, etc.)

bedtools处理的bed文件(0-based 的半开区间)转换成 samtools等处理的基因组索引坐标,只需要起始坐标加1即可。 
 

# $2 为起始位置

awk '{print $1,$2+1,$3,$4}' bedtools_treated.bed > samtools_treated.bed

awk '{print $1,$2-1,$3,$4}' samtools_treated.bed > bedtools_treated.bed

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值