转座子、重复序列一直是我搞不懂的一块。今天梳理了一下这方面的知识,写了一篇笔记。
#参考文献缺失!!!下次一定要记录参考文献!!!#
转座子transposon
一类DNA序列,它们能够在基因组中转录或逆转录,在内切酶的作用下,在其他基因座上出现。I型转座子即反转录转座子,该型转座子会先被转录为RNA,然后利用逆转录酶将该RNA逆转录为cDNA,然后才被插入到目标位点中。“复制-粘贴”。II型转座子也称不复制转座子,其序列两端是两段直接重复序列(direct repeat, dR),与它们接壤的是反向重复序列(invert repeat, iR),中间是插入序列(insert sequence, IS)。所以II型的中间体就是其本身,“剪切-粘贴”。
假基因是一类本来正常,然后因为突变或转座而可能失去原来功能的基因。在环境压力下,某些假基因可以重新被激活,而某些假基因则有着调控基因表达的作用。可总结为“假作真时真亦假”。它们与原来的基因可能很相似,但又可以有很大差异。
人体约有40%的DNA与逆转录病毒有关,其中7.7%的DNA与逆转录病毒非常相似,称之为内源逆转录病毒(endogenous retrovirus, ERV)。
病毒两端有两条相同的序列,LTR(long terminal repear),LTR不编码蛋白,主要起调控作用。中间三段基因,gag编码了衣壳蛋白等结构蛋白,pol编码了逆转录酶、整合酶、蛋白酶这些病毒复制需要的酶,env编码了病毒包膜的糖蛋白。所有的逆转录病毒都有这三个基因。人类的内源逆转录病毒HERV也有这三段基因和两个LTR,也可以像逆转录病毒一样,逆转录到别处。HERV可能是很久之前感染过人体胚胎,然后逐渐扩增到7.7%的规模,但是已经变异失去了制造病毒颗粒的能力。
逆转录转座子retrotransposon不包含env,可能是逆转录病毒的来源。所有反转录转座子都有一个共同特点,就是在其插入位点上产生短的正向重复序列。它是许多真核生物中数量最大的一类可活动遗传成分。在植物中特别丰富,它们是核DNA的一个主要组成部分。哺乳动物中,几乎有一半的基因组包含转座子或残余转座子。
LINE中有编码与逆转录酶/整合酶相似活性的酶,所以可能也能逆转录;长度6K
SINE中则没有编码逆转录酶,(需要在细胞内已有的酶系统的作用下进行转座)可能是在LINE辅助下进行逆转录和整合的。Alu是属于SINE的。长度约300bp
近年的研究显示,灵长目LTR逆转座子已固定在基因组中,已无转座活性(Lander et al.,2001);灵长目动物基因组中仍有转座活性的元件是non-LTR逆转座子,主要包括长散在重复元件LINE1(long interspersed element 1,L1)、Alu元件、SVA元件等
L1是人类基因组中唯一的自主性逆转座子,其拷贝占17%,但只有极少数有转座活性,其中6个活性最高的L1拷贝介导了大部分L1转座活动。
Alu元件不能编码逆转录酶,属于非自主转座子,它们利用L1编码ORF2的逆转录酶进行逆转座活动。属于SINE。是灵长类动物基因组中数量最丰富的逆转座子。
典型的SVA元件长约2 kb。SVA逆转座子起源最晚,是人科动物中特有的逆转座子,属于SINE家族中的一员。
逆转座子对基因组结构的影响来源有两种,一是逆转座过程本身,一是其产生的同源序列:
- 逆转座过程对基因组结构的影响:
1.插入突变
逆转座子对插入位点有选择性
2.侧翼序列转导
转座时,除了对自身进行转录,有时也会将上下游的侧翼序列进行转录。侧翼序列转导可将本来不连锁的基因连接起来,对新基因的形成和基因组的进化都有着重要作用。
3.基因逆转座
基因逆转座(gene retrotranspositon)是指只有基因序列发生逆转座,而不伴随逆转座子的转座过程。有时候,一些mRNA可以采取和Alu、SVA相同的策略,捕获L1的逆转录元件从而逆转录插入到基因组中。复制到新位点的基因来源于mRNA的逆转录,因此并不含有上游调控区域,除非获得新的调控区域,这些基因即成为逆转座的假基因(retropseudogene)
4.DNA双链断裂
5.侧翼序列切除
当L1和Alu插入基因组新位点时,可能会引起邻近基因组序列的缺失。
- 逆转座子同源序列对基因组结构的影响:
1.DNA双链断裂的修复
2.异常重组
3.微卫星的形成
微卫星(microsatellite)也叫短串联重复序列(short t and em repeat,STR)或简单重复序列,是由几个(多为2~4个)碱基对作为核心单位,串联重复形成的一类DNA序列。