Transposable elements(TE)即一段DNA序列能够插入到基因组一个地方,是一段可移动的DNA,转座元件在真核生物基因组中非常常见,小麦基因组更是含有高达85%的转座元件或重复序列。转座元件在玉米中第一次被发现,开始认为转座元件是基因组的垃圾,不行使功能,随着研究的深入,转座元件在基因组进化、基因表达表达调控方面具有重要作用。
上篇博文中提到一篇paper发现基因启动子区域(包括5’非翻译区)MITE插入可以影响基因表达。这篇paper给我打开了一个神秘的大门,让我连续追踪了几篇转座元件研究的文章,以前研究中碰到这类转座元件都是绕着走,主要认为没有什么功能。下面我们就说说基因组中那些年的垃圾。
转座子分为两类:RNA介导的反转录转座子和以DNA-DNA转座的转座子。反转录转座子主要包括三类LTR(长末端重复反转录转座子)、LINE(长散在重复反转录转座子,或者non-LTR)、SINE(短散在重复反转录转座子)。反转录转座子通过复制-粘贴的方式在基因组中扩展。DNA转座子又可以分为自主转座子和非自主转座子,非自主转座子只有在自主转座子存在时才可以转座。该类转座子的转座过程则是通过“剪切-粘贴”的机制进行。
MITE相关知识
上文中提到的MITE转座子就是DNA转座子,其结构与非自主原件相似,具有TIR或者TSD结构,但是又具有反转录转座子的高拷贝性。MITE广泛分布在植物和动物的基因组中,并且多存在于基因富集区,推测其对基因组进化和基因表达具有较大的影响。MITE的长度较短,一般为60-700bp,不能编码转座酶。它具有末端倒转重复序列(terminal inverted repeats, TIRs)和靶位点重复(target site duplication, TSD),