简介
1、概述
BEDTools是可用于genomic features的比较,相关操作及进行注释的工具。而genomic features通常使用Browser Extensible Data (BED) 或者 General Feature Format (GFF)文件表示,用UCSC Genome Browser进行可视化比较。
2、与BEDTools使用相关的基本概念
已有的一些genome features信息一般由BED格式或者GFF格式进行存储。
- genome features: 功能元素(gene), 遗传多态性 (SNPs, INDELs, or structural variants), 已经由测序或者其他方法得到的注释信息,也可以是自定义的一些特征信息。
- genome features的基本信息: 染色体或者scaffold的位置, 起始位置,终止位置,哪条链,feature的name
- Overlapping / intersecting features: 两个genome features的区域至少有一个bp的共同片段
3、BED和GFF文件的一个差异
BED文件中起始坐标为0,结束坐标至少是1,; GFF中起始坐标是1而结束坐标至少是1。
安装
注意:下面的代码中是需要下载的工具的版本号
1 |
curl http://bedtools.googlecode.com/files/BEDTools.******. tar .gz > BEDTools. tar .gz |
2 |
tar -zxvf BEDTools. |