HISAT2是一款快速、敏感的序列比对软件。使用改进的BWT算法,相比Bowtie/TopHat2具有更高的敏感性和更快的运算速度。
官网下载链接:http://www.psc.edu/user-resources/software/hisat2
安装HISAT2
我采用conda安装,也是最简单的方法
conda install -c bioconda hisat2
conda install -c bioconda/label/cf201901 hisat2
或者从官网下载安装包
解压:unzip hisat2-2.1.0-beta-Linux_x86_64.zip
添加环境变量:vim ~/.bashrc
export PATH=/User/your_path:$PATH
保存退出:source ~/.bashrc
建立索引
建立基因组索引:hisat2-build –p 4 genome.fa genome
建立基因组+转录组+SNP索引:
hisat2提供了两个python脚本将GTF文件转换成hisat2-build能使用的文件
extract_exons.py genome.gtf > genome.exon
extract_splice_sites.py genome.gtf > genome.ss
另外,分析SNP可以将其信息加入至索引中。
extract_snps.py snp.txt > genome.snp
最后,使用将基因组,转录组,SNP建立索引。
hisat2-build -p 8 genome.fa --snp genome.snp --ss genome.ss --exon genome.exon genome_snp_tran_index
不添加转录本和SNP也可以建立
hisat2-build -p 8 genome.fa genome_index
官方