模棱两可的生物学概念问题辨析1

一 . 转录的模板链到底是哪一条链?

  1. 与mRNA序列相同(只是U 换成T)的DNA链称为编码链(非模板链,有义链);指导mRNA合成的,与其互补配对称为模板链(非编码链,反义链)。

  2. 基因在染色体上有特定的排列顺序,RNA聚合酶在进行转录时只能沿着5‘~3’方向进行,而且转录所需要的启动子元件相对于下游结构基因的位置也决定了其转录的方向(当然二者方向是一致),所以对于特定的基因,转录时也只能是用特定的一条DNA链作为模板

  3. 对于一条给定的染色体,上边的基因在进行转录时,转录方向依据基因方向不同而不同,不同转录方向就要用不同的编码链做模板,所以DNA的两条链都有机会作为模板进行转录,但对于一个特定的基因,其在染色体上的位置和方向是固定的,那么这一个基因转录时,只会用到两条DNA链中的一条作为模板。

  4. 那么是不是说DNA双链总有一半都是浪费的呢?不是,因为对于某些重叠基因,两个重叠基因分布一段区域的对应的两条链上

  5. 很重要的一点:在基因浏览器,如NCBI或UCSC的geneBrowser中,默认从左到右是5‘到3’,箭头指向右边的基因A位于从左到右为5‘到3’的DNA链,该基因相对于它转录而成的mRNA而言,是位于非模板链,正义链(+ plus strand),有义链(sense strand),编码链(coding strand),也叫(Crick strand),而另一条的就是Watson strand。二者方向相同,而剪头指向左边的基因B,应该位于DNA的另一条链上,在另一条链上基因B的剪头也是指向5‘到3’

    所以在示意图上可以看到基因A(5’→3‘), 基因B(3’←5’) 这些箭头方向与其基因转录方向也是一致的

    以上内容来自知乎 UCSC tutorial

二. 基因结构中的启动子 外显子 UTR CDS辨析

参考:真核生物基因示意图

生信情报站

生信菜鸟团

​ 《基因八》

  1. 从转录(DNA转录为Pre-mRNA)的角度上说,可以先把基因在结构上可以大致分为 转录区 和 非转录区(该名词我自造的),非转录区主要是一些调控元件,例如增强子/沉默子、启动子。这里注意终止子序列会被转录:
  • 启动子:一般位于基因的转录起始位点(TSS) 5’段上游,长约100-1000bp, 转录时RNA聚合酶和转录因子特异性识别并结合启动子,从而启动转录,本身并不转录,CCAAT box 和 TATA / Pribnow box 是常见的启动子元件;

  • 增强子:位于转录起始位点上游或下游基因1Mbp的位置,长度50-1500bp的序列,其可以被转录激活因子结合从而大大增强特定基因启动子的活性。其位置和作用方向不限。沉默子功能与之相反。

  • 终止子:是聚合酶识别转录终止的一段DNA序列信号,会被转录pre-mRNA。举个例子,在原核生物中存在的一种内在终止子,它会被转录成为发夹结构,从而利用结构特点而终止转录。

  1. 从转录后修饰(pre-mRNA 加工为 成熟的 mRNA)角度上说,转录区可分为外显子和内含子

    • 外显子:在真核生物中pre-mRNA 加工后留下来的DNA序列,并最终出现在成熟mRNA的基因序列中,按照《基因八》说法,外显子的序列包含在成熟RNA中,精确的说,一个成熟转录物起始于一个外显子的5‘段,终止于另一个外显子的3’段;

    • 内含子:在真核生物中,内含子作为阻断基因的线性表达的一段DNA序列,是在pre-mRNA经过剪切或修饰等加工后被切除的DNA序列;
      当然,最后加工过程还包括5‘段加帽,3’段加Poly-A尾。

  2. 从翻译的角度上看:成熟的 mRNA 可以分为 编码区 和 非编码区,非编码区主要分为5‘UTR 和3’UTR, 分别位于起始密码子的上游和终止密码子的下游。(那么外显子区域有没有包括5‘、3’ UTR呢?)

    • CDS 序列:基因中DNA 或 RNA 中 蛋白质编码区域,通常开始于5’末端的起始密码子,结束于3’段的终止密码子。

    • ORF序列:从蛋白质翻译的角度上,是在给定的一条DNA或者RNA序列中,从一个起始密码子开始ATG,按照三联体规则直至找到一个终止密码子的整个过程,由于读法不同,一段序列可能有多种不同的读取方式,因此可能同时存在许多不同的ORF,它是理论上编码一段氨基酸序列的DNA或RNA序列,实际上可能并不表达,一般可以用计算机程序来分析

      二者区别:CDS一定是一个ORF,当然也可能包括很多ORF;但是ORF就不一定是CDS了

三. 转录本(transcripts)

  • 由于存在可变剪切,绝大多数成熟mRNA并不是简单的剪掉内含子,所有外显子拼在一起。而是存在着多种剪切方式,比如内含子滞留(intron retention)、可变5’/3’剪切位点的选择、外显子包含或跳跃等。也就是说可变剪切的存在使得外显子、内含子之间的严格定义变得模糊。导致某些基因转录后由于加工的不同形成不同的成熟mRNA,我们称之为isoform,或者 转录本(transcripts),每个基因可能在会转录多个转录本,但是不一定都会被表达为蛋白,比如会 存在RNAi 将其中一些降解掉。不过,RNA-seq 会测到所有的转录本,因此可用于检测可变剪切。在NCBI Gene 中可以找到一个基因对应的多个转录本和表达的蛋白序列,标记分别为 NM NP
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值