我们知道,mRNA 因为可变剪切丢失了内含子,因此不能像 DNA 数据那样简单地比对到基因组上。
如上图所示,mRNA reads 比对到基因组可能出现 3 种情况:
read 完全比对到 1 个 exon 内(红色)
read 跨越 2 个 exon(蓝色)
read 跨越 2 个以上的 exon(紫色)
过去的 10 多年,已经开发了多种比对工具来应对快速增长的 RNA-Seq 测序数据,本文就来盘点一下其中几个比较经典的工具。
2009 TopHat
TopHat 是一款经典的 RNA-Seq 数据比对软件,能够精确地将测序 reads 比对到基因组上。其利用 Bowtie 进行快速比对,并考虑了剪接事件,提高了对剪接变异的检测灵敏度。曾经 Tophat + Cufflinks 作为转录组数据分析的标准流程,不知帮多少人完成了毕业论文,可以说为转录组学的发展立下了汗马功劳。但江山代有人才出,随着新软件工具的出现,经典也逐渐落幕,现在已经是不推荐使用了。
2013 TopHat2
4年之后,TopHat 迎来了升级版,采用了更先进的比对算法,提供