TopHat是一个基于Bowtie的RNA-Seq数据分析工具。它可以快速确认exon-exon剪切拼接事件。TopHat有Linux和OS X x86_64编译版本,当然也可以使用原代码编译适合自己操作系统的版本。
其上游软件是Bowtie,下游是Cufflinks。
理论上,TopHat是针对Illumina Genome Analyzer而设计的软件,它偶尔也能对其它来源的数据进行分析,但不保证成功。它针对75bp以上长度的短序进行了优化。
在使用TopHat前,必须将Bowtie的可执行文件的目录输出到PATH变量中去,例:export PATH=$PATH:/share/sbin/bowtie
确保TopHat可以运行bowtie, bowtie-inspect以及bowtie-build。
还需要下载安装samtools。
TopHat的使用范例:
[shell]
tophat [options]* [reads1_2,...readsN_2]
[/shell]
先下载测试文件,并解压。
[shell]
tar zxvf test_data.tar.gz
cd test_data
tophat -r 20 test_ref reads_1.fq reads_2.fq
[/shell]
如果成功的话,可以看到类似下面的输出:
[shell]
[Mon May 4 11:07:23 2009] Beginning TopHat run (v1.1.1)
-----------------------------------------------
[Mon May 4 11:07:23 2009] Preparing output location ./tophat_out/
[Mon May 4 11:07:23 2009] Checking for Bowtie index files
[Mon May 4 11:07:23 2009] Checking for reference FASTA file
[Mon May 4 11:07:23 2009] Checking for Bowtie
Bowtie version: 0.9.9.1
[Mon May 4 11:07:23 200