tophat 原理_使用TopHat分析RNA-Seq结果

TopHat是一款基于Bowtie的RNA-Seq数据分析工具,专注于exon-exon剪切拼接事件的确认。它适用于75bp以上的短序列数据,依赖于Bowtie、samtools等工具。在使用前需配置Bowtie环境并安装samtools。TopHat通过多步映射策略寻找剪接接头,包括分段映射、闭合搜索和覆盖范围搜索等。用户需提供正确的参数如插入片段中值、最大内含子长度等。通过示例展示了如何运行TopHat并解释了部分参数含义。
摘要由CSDN通过智能技术生成

TopHat是一个基于Bowtie的RNA-Seq数据分析工具。它可以快速确认exon-exon剪切拼接事件。TopHat有Linux和OS X x86_64编译版本,当然也可以使用原代码编译适合自己操作系统的版本。

其上游软件是Bowtie,下游是Cufflinks。

理论上,TopHat是针对Illumina Genome Analyzer而设计的软件,它偶尔也能对其它来源的数据进行分析,但不保证成功。它针对75bp以上长度的短序进行了优化。

在使用TopHat前,必须将Bowtie的可执行文件的目录输出到PATH变量中去,例:export PATH=$PATH:/share/sbin/bowtie

确保TopHat可以运行bowtie, bowtie-inspect以及bowtie-build。

还需要下载安装samtools。

TopHat的使用范例:

[shell]

tophat [options]* [reads1_2,...readsN_2]

[/shell]

先下载测试文件,并解压。

[shell]

tar zxvf test_data.tar.gz

cd test_data

tophat -r 20 test_ref reads_1.fq reads_2.fq

[/shell]

如果成功的话,可以看到类似下面的输出:

[shell]

[Mon May 4 11:07:23 2009] Beginning TopHat run (v1.1.1)

-----------------------------------------------

[Mon May 4 11:07:23 2009] Preparing output location ./tophat_out/

[Mon May 4 11:07:23 2009] Checking for Bowtie index files

[Mon May 4 11:07:23 2009] Checking for reference FASTA file

[Mon May 4 11:07:23 2009] Checking for Bowtie

Bowtie version: 0.9.9.1

[Mon May 4 11:07:23 200

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值