欢迎关注”生信修炼手册”!
STAR是一款RNA_seq数据专用的比对软件,比对速度非常快,最大的优势是灵敏度高,GATK推荐采用STAR比对,然后进行下游的SNP分析。软件的源代码保存在github上,地址如下
https://github.com/alexdobin/STAR
安装过程如下
wget https://github.com/alexdobin/STAR/archive/2.6.1b.tar.gz
tar xzvf 2.6.1b.tar.gz
解压缩之后,在bin/Linux_x86_64_static
目录下,提供了编译好的可执行文件STAR
。和hisat等软件不同,STAR将所有的功能整合在了同一个程序中,通过切换runMode来执行不同的任务。
1. 构建基因组索引
运行比对前,首先需要对基因组建立索引,建立索引对应的runMode为genomeGenerate
, 基本用法如下
STAR --runMode genomeGenerate \
--runThreadN 20 \
--genomeFastaFiles hg19.fasta \
--genomeDir hg19_STAR_db \
--sjdbGTFfile hg19.gtf \
--sjdbOverhang 149
建立索引需要基因组的fasta和gtf文件,通过genomeFastaFiles
和