重复序列定义以及分类

本文探讨了DNA重复序列,包括串联重复(如巨型卫星DNA、卫星DNA等)和散在重复(如转座元件,分为DNA转座子和逆转录转座子,其中LTR逆转录转座子在人类基因组占比高)。特别关注了LINE-1、Alu和SVA等非LTR元件的特性及其在人类基因组中的活动。文章还提及了APOBEC3H蛋白对SVA反转座作用的影响以及基因组重复度量的研究进展。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

DNA重复序列分为常见重复(Common repeats)及片段重复序列(Segmental duplications)


常见重复序列(Common Repeats,CRs)可分为两大类:串联重复序列(Tandem Repeats,TRs)和散在重复序列(Interspersed repeats)


串联重复序列指的是相邻出现的一个或多个特定的核苷酸,依据其串联单元的长度和序列特征可以分为巨型卫星DNA(Megasatellites),卫星DNA(Satellite DNA),小卫星DNA(Minisatellites)以及微卫星DNA(Microsatellites)


散在重复序列转座元件转座子(Transposable Elements,TEs),也称为跳跃基因。转座子被分成两大类:DNA转座子(DNA transposons)和逆转录转座子(retrotransposons)。

DNA转座子可直接由几种转座酶催化完成转座过程,其转座机制不涉及RNA中间体。

逆转录转座子是在“复制-粘贴”的机制下,通过RNA中间体转座DNA序列。按照有无长末端重复序列(Long Terminal Repeats,LTR),可将逆转录转座子分为LTR元件和Non-LTR元件。


 LTR逆转录转座子 内源性逆转录病毒是目前人类基因组中LTR逆转录转座子的主要来源,约有8%的人类基因组序列由其构成。

研究显示,2500万年前,绝大多数内源性逆转录病毒已被整合进入人类基因组,到现在其转座能力已非常有限I。虽然大部分内源性逆转录病毒已经不具备逆转座能力,但是少量的HERV-K 元件仍保留着一定的逆转座能力,它们具有完整开放阅读框,在活化之后具有病毒感染性。内源性逆转录病毒虽然大部分已不再发生转座作用,但也在一定程度上对哺乳动物的基因组产生了影响。随着研究的深入,有数据显示,内源性逆转录病毒在一定程度上影响了其他内源基因的剪切和转录,甚至对表观遗传的调节都发挥着一定的作用。


Non-LTR逆转录转座子可分为三类,分别是长散布元件(如LINE-1)、短散布元件(如Alu元件,SINE)和其他(SVAs,如SINE-R、VNTR、Alu样序列等)。Non-LTR逆转录转座子是人类基因组中最常见的转座子,也是人类基因组中最活跃的转座子,大约在人类基因组中占三分之一。

1. LINE-1 

      长散布元件1(Long Interspersed Elements-1,LINE-1)是目前发现的唯一一个能够发生自主性转座的逆转录转座子,它自身能够翻译产生反转录所需要的酶,超过30%的人类基因组是由LINE-1逆转录转座直接或间接得到的。尽管LINE-1在人类基因组中存在的拷贝数目已经超过500,000个,但大多数LINE-1由于点突变,重排或截短而失去活性,估计有80~100个元件目前仍活跃于个体。人的全长LINE-1长约6.0 kb,含有位于5’非翻译区(UTR)的内部启动子和两个不重叠的开放阅读框,ORF1和ORF2,由一个短的内部ORF spacer间隔,这两个ORF都是LINE-1反转录转座所必需的。

2. SINE

Alu是最为常见的SINE(Short Interspersed Elements),完整片段约为300bp,是从7SLRNA 进化而来的,是灵长类动物特异性的SINE。它是目前在人类中最具有活性的逆转录转座子,具有超过 100万份拷贝。在5区域内具有一个内源性的RNA聚合酶III启动子,结尾处具有长度可变的polyA1231。AluSRP9/14结合位点的突变严重减弱了逆转录转座,而AuSRP9/14结合位点中的双突变消除了工程化Alu逆转录。Alu不具有编码蛋白的能力,为非自主逆转座子,需要借用LINE-1编码的蛋白完成逆转录过程。

3.SVA

灵长类动物的基因组大约在2,500万年前进化出现了SVA元件,目前的数据显示在人类基因组中约有2700-3000个拷贝数,是目前已知的在人类基因组中含量最少的的反转座子。从拷贝数来看,SVA元件的数目远少于LINE-1和Alu,但是至今SVA仍保留着的逆转座能力,但其活性仅为LINE-1的1/5和ALu活性的1/7。SVA家族可进一步分为7个亚家族,按年龄顺序命名为A-F1。SVAA是进化期最长的亚科,距今约13.6Myrs,SVAE,F距今分别为3.5 Myrs 和3.2Myrs,F1是最年轻的亚科,而亚科D和B 则是基因组中最丰富的亚科,约占40%和15%的SVA元素总数。SVA E,F和F1是人类特异性的,并且与SVA D一起是在人群中仍然是多态的亚科。

资料参考

论文:APOBEC3H蛋白对SVA反转座作用的调控机制研究

论文:基因组重复度量化及重复序列从头鉴定

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值