欢迎关注微信公众号《生信修炼手册》!
融合基因是指两个或者多个基因联合起来,共同转录形成一个转录本,融合基因可以作为某些疾病的特异分子标记,常见的有以下几种
- bcr/abl融合基因存在于95%以上的慢性粒细胞白血病患者中;
- AML1/ETO融合基因主要见于急性粒细胞白血病部分分化型患者中;
- CBFβ/MYH11融合基因是M4Eo型白血病的分子标志;
- PML/RARα融合基因是急性早幼粒细胞白血病(APL)的分子标志
利用RNA_seq的数据,我们可以检测融合转录本,从而识别融合基因。 fusionMap就是这样的一款工具,官网如下
通过两种方式来检测融合基因
- 对于没有比对上基因组的序列,即unmapped reads, 通过识别Fusion junction-spanning reads 来识别融合基因;这部分reads覆盖到了融合基因的连接点,在连接点两侧的序列分别比对到构成融合的多个基因上
- 对于比对上基因组的reads, 通过识别 Inter-transcript read pairs来识别融合基因,这部分reads虽然没有直接覆盖连接点,但是其R1端和R2端分别比对到不同的基因
示意图如下