文章目录
10. 真核生物基因表达调控
● 真核生物与原核生物的差别
- 原核生物:单细胞;基因组织方式——操纵子;调控——短期转录。
- 真核生物:
蛋白或者多细胞;稀少的操纵子;
调控——短期转录和长期调控;
目标:在不同的时间不同的细跑中协调新蛋白的产生。
● 真核细胞与原核细胞在基因转录,翻译及 DNA 的空间结构方面存在如下差异:
(1) 在真核细胞中,一条成熟的 mRNA 链只能翻译出一条多肽链,原核生物中常见的多基因操纵子形式在真核细胞中比较少见。
(2) 真核细胞的 DNA 与组蛋白和大量非组蛋白结合,只有一小部分 DNA 是裸露的。
(3) 高等真核细胞 DNA 中大部分不转录,真核细胞中有一部分由几个或几十个碱基组成的 DNA 序列,在整个基因组中重复几百次甚至上百万次。此外,大部分真核细胞的基因中间还存在不被翻译的内含子。
(4) 真核生物能够有序地根据生长发育阶段的需要进行 DNA 片段重排,还能在需要时增加细胞内某些基因的拷贝数,这种能力在原核生物中也是极为鲜见的。
(5) 在原核生物中,转录的调节区都很小,大都位于转录起始位点上游不远处,调控蛋白结合到调节位点上可直接促进或抑制 RNA 聚合酶对它的结合。在真核生物中,基因转录的调节区则大得多,它们可能远离核心启动子几百个甚至上千个碱基对。虽然这些调节区也能与蛋白质结合,但是并不直接影响启动子区对于 RNA 聚合酶的接受程度,而是通过改变整个所控制基因 5’上游区 DNA 构型来影响它与 RNA 聚合酶的结合能力。
(6) 真核生物的 RNA 在细胞核中合成,只有经转运穿过核膜,到达细胞质基质后,才能被翻译成蛋白质。原核生物中不存在这样严格的空间间隔。
(7) 许多真核生物的基因只有经过复杂的成熟和剪接过程,才能被顺利地翻译成蛋白质。
10.1 转录水平的调控 (transcriptional regulation)
- 转录调控决定一个基因是否转录和转录的速度
- 与原核基因表达调控类似,真核基因的表达调控主要是转录调控
● 真核生物转录水平调控的特点
- 核小体结构及其修饰影响调控蛋白与 DNA 的结合和相互作用
- 与原核生物相比,真核生物 DNA 上具有更多的调控结合位点和更多的调控蛋白
10.1.1 转录起始调控 Transcriptional initiation
● 转录起始调控元件:
1)RNA 聚合酶 (RNA Polymerase):
- 真核生物有 3 种 RNA 聚合酶,催化转录不同 RNA 产物。
- 只有 RNA 聚合酶Ⅱ能够转录 mRNA 前体,并在加工成熟后按照三联子密码的原理翻译成蛋白质产物,因此,主要讨论 RNA 聚合酶Ⅱ的基因转录及其调控过程。
- 启动子,调节序列和调节蛋白通过 DNA-蛋白质相互作用、蛋白质-蛋白质相互作用影响 RNA 聚合酶活性。
2)顺式作用元件 (cis-acting elements
): 基因组中含有可以调控自身基因表达活性的特异 DNA 序列。promoters/regulatory sequences of genes. 启动子和基因的调节序列。包括:启动子、增强子、沉默子等。
3)反式作用因子 (trans-acting factors
): proteins (and RNAs) that bind cis-elements and promote or repress gene expression. 能够结合在顺式作用元件上调控基因表达的蛋白质或 RNA。
RNA 聚合酶Ⅱ
RNA 聚合酶Ⅱ
是一类能够直接或间接与启动子核心序列 TATA 区特异结合,并启动转录的调节蛋白。- RNA 聚合酶Ⅱ在转录因子帮助下,形成转录起始复合物。
- RNA 聚合酶Ⅱ由至少 10~12 个亚基组成,其中 2.4×105 最大亚基的羧基末端含有由 7 个氨基酸残基 (
Tyr-Ser-Pro-Thr-Ser-Pro-Ser
) 组成的多磷酸化位点重复序列,称为羧基末端结构域 (CTD
)。 - 在生理条件下,RNA 聚合酶Ⅱ转录某个基因时通常需要与 20 种以上的蛋白质因子(以 TFⅡ表示)结合形成转录起始复合物。TFⅡD、TFⅡB 和 TFⅡF 与 RNA 聚合酶Ⅱ可在启动子上形成最初级复合物,开始转录 mRNA,加入 TFⅡE 和 TFⅡH 后形成完整的转录复合物并转录出长链 RNA,加入 TFⅡA 可进一步提高转录效率。RNA 聚合酶Ⅱ沿模板滑动时,TFⅡD 及 TFⅡA 滞留在转录起始位点上,其他因子随聚合酶向模板 DNA 的 3’端移动。
● RNA 聚合酶Ⅱ如何整合成为转录起始复合物,有两种假说:
① “一步结合”论 one-step
:RNA 聚合酶Ⅱ先同大量的转录因子和转录相关蛋白结合成转录复合体,然后在 TATA 区结合蛋白 (TBP
) 的帮助下结合到 DNA 上,起始基因转录。
② “分步结合”理论 multiple-step
:顺序组装
- TFⅡD (TBP + 11 TAF, 800KD)与 TATA 区结合是启动的第一步。
TBP
: TATA binding protein TATA 区结合蛋白
TAFs
: TBP associated factors TBP 相关因子 - TFⅡB 与 DNA 结合并在 RNA 出口位点和活性中心附近与 RNA 聚合酶接触,并将其定向在 DNA 上。
CTD
: RNA PolⅡ C 末端结构域
- 开始转录时需要通过 TFⅡH 的激酶活性使 CTD 磷酸化以释放 RNA 聚合酶。
- TFⅡE 和 TFⅡH 融化 (melt) DNA 以使聚合酶移动。
- CTD(通过 TFⅡH 和其他激酶)的磷酸化是延长开始启动 PolⅡ 所必需的。
- CTD 可以协调 RNA 与转录的加工。
- 在真核细胞中,CTD 在空间和时间上进行精确调控基因的转录。
- CTD 含 25~ 52 个氨基酸,都包含 7 元重复序列 Y1S2P3T4S5P6S7,这个 7 元重复序列上 2 位和 5 位的丝氨酸是蛋白质的主要磷酸化位点。
- CTD 重复序列上的磷酸化导致其结构中部分脯氨酸的构象发生变化,使之更容易与其他转录相关因子结合(磷酸化组合方式不同,招募的转录因子不同),从而提供一个动态的有利于形成转录复合物的平台。
- S2和S5:转录调控的触发器。在 RNA 聚合酶Ⅱ参与转录调节的整个过程中,其 CTD 上 2 位和 5 位丝氨酸的磷酸化能够引发并确保转录过程各个步骤的顺利进行。
① 转录起始阶段:CTD 上 5 位丝氨酸的磷酸化 PhosphoS5 是形成转录起始复合物PIC
(pre-initiation complex) 的必要前提。并且通过募集加帽酶促进 mRNA 加帽。
② 转录延伸阶段 Elongation:PhosphoS5 逐步去磷酸化,S2 逐步磷酸化。
③ 转录终止过程 Terminating:PhosphoS2 通过触发招募 3’-RNA 加工机器确保高效的 3’-RNA 加工。
④ 转录结束 Ending:CTD 不含磷酸基团,有助于转录复合物的解离,使 RNA 聚合酶Ⅱ与新的启动子相结合,启动新一轮基因转录。
顺式作用元件
● 顺式作用元件能够被转录调节蛋白特异识别和结合,从而影响基因表达活性。
- 核心启动子元件(Core promoter elements):结合 RNAPⅡ和 GTF(general TF)。
- 调控元件(Regulatory Elements):增强子 (enhancer)、沉默子 (silencer): 结合调节蛋白
★ 核心启动子元件(Core promoter elements)
-
真核基因启动子由核心启动子和上游启动子两个部分组成,是在基因转录起始位点 (+1) 及其 5’上游 100~ 200 bp 以内的一组具有独立功能的 DNA 序列,每个元件长度为 7~20bp, 是决定 RNA 聚合酶Ⅱ转录起始位点和转录频率的关键元件。
-
(1) 核心启动子 (core promoter) 是指保证 RNA 聚合酶Ⅱ转录正常起始所必需的、最少的 DNA 序列,包括转录起始位点及转录起始位点上游 -25 ~ -30 bp 处的 TATA 区。核心启动子单独起作用时,只能确定转录起始位点并产生基础水平的转录。
BRE: TFⅡB recognition element | TATA: TATA Box | TFⅡ: transcription factor for Pol Ⅱ |
---|---|---|
TBP: TATA binding protein | Inr: initiator element | DPE: Downstream promoter element |
- (2) 上游启动子元件 (upstream promoter element,
UPE
) 包括通常位于 -70 bp 附近的 CAAT 区 (CCAAT) 和 GC 区 (GGGCGG) 等,能通过 TFⅡD 复合物调节转录起始的频率,提高转录效率。
● 调控元件(Regulatory Elements)
- 通常位于核心启动子上游,对于体内有效的转录是必须的。
- 可以分为几类:
① 启动子近端元件;
② 上游激活序列 (UASs, 增强子
)
③ 一系列抑制元件(沉默子)
④ 界面元素 (boundary elements
)
⑤ 绝缘体 (insulators
) - 所有这些 DNA 元件都与调节蛋白(激活剂和阻遏物)结合,从而帮助或阻碍核心转录启动。
- 对于每一个基因,都有一个、几个或许多特定的调控元件进行组合,精细调节其开关。不同调控元件的组合可以调控打开或关闭特定基因的数量和位置。
- 增强子有助于进一步提高基因的转录。
★ 增强子 enhancer
-
增强子是指能使与它连锁的基因转录频率明显增加的 DNA 序列。
-
增强子的特性:
1)增强效应十分明显。
2)增强效应与其位置和取向无关。距离启动子有一定的距离,可以位于其上游或者下游。
3)大多为重复序列,一般长约 50bp,适合与某些蛋白因子结合。常含有一个核心序列:(G)TGGATA/TA/T©,该序列是产生增强效应时所必需的。
4)其增强效应有严密的组织和细胞特异性,说明增强子只有与特定蛋白质(转录因子)相互作用才能发挥功能。
5)没有基因专一性,可以在不同的基因组合上表现增强效应。
6)许多增强子还受外部信号的调控,如金属硫蛋白基因启动区上游所带的增强子,就可以对环境中的锌、镉浓度做出反应。 -
远程调控机制:(为什么增强子的作用与距离和方向无关?)
① 成环(目前普遍接受的机制):影响模板附近的 DNA 双螺旋结构,导致 DNA 双螺旋弯折或在反式作用因子的参与下,以蛋白质之间的相互作用为媒介形成增强子与启动子之间“成环”连接,活化基因转录。Cohesins
( 黏连蛋白) 有助于稳定增强子。
② 滑动:将模板固定在细胞核内特定位置,如连接在核基质上,有利于 DNA 拓扑异构酶改变 DNA 双螺旋结构的张力,促进 RNA 聚合酶Ⅱ在 DNA 链上的结合和滑动;
③ 增强子区可以作为反式作用因子或 RNA 聚合酶Ⅱ进入染色质结构的 “入口”。
-
增强子的基本作用是 增加启动子附近的激活子浓度
◆ 增强子可以通过将蛋白质带到启动子附近而起作用。
◆ 增强子不作用于长线性 DNA 相反端的启动子,但当 DNA 通过蛋白质桥连接成环时增强子能发挥作用。
◆ 增强子和启动子位于不同环状 DNA 分子时增强子不起作用,但是当两个环链接在一起时能起作用。
反式作用因子 (
trans-acting factor
)
- 能直接或间接与顺式作用元件相互作用,进而调控基因转录的一类调节蛋白,统称为反式作用因子。
- 按照功能分三类:
1)基本转录因子:识别 promoter 元件
2)转录调节因子:识别 enhancer 或 silencer
3)共调节因子:不能进行 DNA-蛋白质相互作用
1)基本转录因子 (general transcription factors, GTFs
):是指能够直接或间接与启动子核心序列 TATA 盒特异结合、并启动转录的一类调节蛋白。
2)转录调节因子
◆ 这类调节蛋白能识别并结合转录起始点的上游序列和远端的增强子元件(沉默子),通过 DNA-蛋白质相互作用而调节转录活性。决定不同基因的时间、空间特异性表达。
◆ 常将基本转录因子和转录调节因子统称为转录因子 (transeription factor, TF
)。
- 转录激活因子 (transcriptional activator)
- 转录抑制因子 (transcriptional repressor)
3)共调节因子 (transcriptional regulator/ co-factor):本身无 DNA 结合活性,但能与转录因子发生蛋白-蛋白相互作用,进而影响它们的分子构象,以调节转录活性。
- 共激活因子:与转录激活因子有协同作用
- 共抑制因子:与转录抑制因子有协同作用。
- 功能:通过与激活因子和 GTFs(普通转录因子)相互作用参与转录的激活。
- 结构:一种大的多蛋白复合物,不直接与 DNA 结合。
★ 转录因子通常含有结构域
- DNA 结合域 (DNA binding domain,
DBD
):碱性氨基酸结合域 Basic AA (K/R) rich, positively charged 带正电(容易与 DNA 结合)【K 赖氨酸 Lys;R 精氨酸 Arg】 - 转录激活域 (trans-activation domain,
TAD
):酸性激活域 (D/E-rich); 谷氨酰胺 (Q) 富含域;脯氨酸 P 富含域。【D 天冬氨酸 Asp;E 谷氨酸 Glu】
★ TF 中常见的 DNA 结合域 (
DBD
)
(1) Zinc Finger
锌指结构:锌指结构家族蛋白特有的半胱氨酸 C 和组氨酸 H 残基之间氨基酸残基数基本恒定,有锌参与时才具备转录调控活性。
- Cys-X2-4-Cys-X3-Phe-X5-Leu-X2-His-X3-His
- C-terminal: α-helix → binding DNA
- C2H2 (两个半胱氨酸+2 个组氨酸)是最常报道的哺乳动物转录因子中的一类锌指,主要结合在 DNA 双螺旋结构的大沟中。
- 常结合 GC box。
- 识别螺旋位置:螺旋上的-1,2,3 和 6 位置。
- 多肽序列与碱基间的相互作用:每一个锌指的 α-helix 可以特异识别 3-4 个碱基。
(2) 碱性亮氨酸拉链 (basic-leucine zipper), 即 bZIP
结构
- 亮氨酸拉链蛋白是二聚体,拉链螺旋位于蛋白质的 C-末端
- 在螺旋的每第 7 位有 L 亮氨酸 Leu,在二聚体中面对面
- N-末端螺旋具有 正电荷的氨基酸 (K/R) :结合 DNA 大沟
(3) Homeodomain 同源异型域:
- 同源域是指编码 60 个保守氨基酸序列的 DNA 片段,它广泛存在于真核生物基因组内。
- 属于螺旋-转角-螺旋家族 (helix-turn-helix,
HTH
) 蛋白,每个同源异形域蛋白包括三个 α 螺旋,第二和第三个螺旋形成螺旋转角-螺旋模体。 - 同源域蛋白通过其第 3 个螺旋与链 DNA 的大沟相结合。其 N 端的延伸部分则与 DNA 的小沟相结合,提高了稳定性。
(4) bHLH
结构 (basic-Helix-Loop-Helix 碱性-螺旋-环-螺旋)
- 来自两个单体中的每一个延伸的 α 螺旋区域插入 DNA 的大沟中
- 二聚化表面由两个螺旋区域形成
- 亮氨酸拉链和 HLH 蛋白通常被称为碱性拉链 bZIP 和碱性 HLH 蛋白 bHLH
- 肌细胞定向分化的调控因子 MyoD-1、原癌基因产物 Myc 及其结合蛋白 Max 等都属于 bHLH 蛋白。
- bHLH 类蛋白只有形成同源或异源二聚体时,才具有足够的 DNA 结合能力。当 HLH 蛋白二聚体中的一方无碱性区时,该二聚体明显缺乏对靶 DNA 的亲和力,不能结合 DNA。
★ TF 常见的转录激活域 (
TAD
)
-
在真核生物中,反式作用因子的功能由于受蛋白质-蛋白质之间相互作用的调节变得精密、复杂,完整的转录调控功能通常以复合物的方式来完成,这就意味着并非每个转录因子都直接与 DNA 结合。
-
转录激活/活化域(
trans-activation domain
)是反式作用因子中唯一的结构基础。 -
反式作用因子的功能具有多样性,其转录活化域也有多种,通常依赖