文献精读1---拟南芥二倍体和四倍体之间染色体互作与组蛋白修饰和转录调控的影响

原文 " The effects of Arabidopsis genome duplication on the
chromatin organization and transcriptional regulation "
doi: 10.1093/nar/gkz511
文章概述:使用HiC技术比较二倍体与同源四倍体之间染色体在空间上的互作差异,再结合RNA-seq和Chip-seq分析基因组加倍、染色质互作、组蛋白修饰、基因转录水平之间的关系

三维基因组简介

三维基因组的层次结构研究中:染色体在核内不是随机的缠绕为零乱的团,它是按照一系列从低到高的构特征排列,来参与基因调控。
在这里插入图片描述
1.染色质疆域(Chromosome territory): 在细胞核的分裂间期,不同染色体占据核内的不同空间位置;其中,核小体动态亚核结构(nuclear speckle),属于前mRNA剪接因子储存聚集的区域,核纤层(nuclear lamina),纤维蛋白构成的纤维网架体系。
2. 区室:在Chromatin上某一系列的区域之间会更倾向于与同一系列内部的区域相互作用,而与另外其他系列的相互作用较弱,这样就把每一条Chromatin分为两类,在哺乳动物中称为compartment A 和B,compartment A 一般对应一些比较活跃的有高基因密度、高基因表达、active组蛋白修饰的区域,而compartment B 则主要对应的是异染色质区域、且基因的表达量较低。在这篇论文中,拟南芥染色体壁被分为松散的LSD结构域和紧凑的CSD结构域,分别对应哺乳动物中的A区室和B区室。
3. 拓扑关联结构域,TAD: 代表的是局部区域有着很强的内部相互作用,而区域与区域之间的相互作用则较弱,这些domain 的边缘部分会有一些关键的结构蛋白(CTCF)。
4. loops结构:代表着DNA序列上两个比较精细的区域之间有很紧密的相互作用,形象地看成这两个部分形成像环一样的结构来调控基因的功能;在目前比较认可的model中,关键结构因子cohesin在结合到基因组上之后,在染色质上进项滑动,在向两侧滑动的时候,就把内部的DNA挤出来形成一个环,且这滑动不是无静止的,当遇到这个CTCF的结合位点时滑动就停止了,这就是loop一般都形成在两个CTCF之间的原因。

在拟南芥的三位基因组研究中,作者介绍了拟南芥的着丝粒像绝缘体一样阻断了两个臂之间的相互作用;也无明显的TADs。

三维基因组研究策略

在这里插入图片描述
细胞学方法:FISH、GISH,基于显微镜,使用带荧光的探针去结合基因组上我们想看的特定序列,在显微镜下得到这些特定序列在细胞内的位置和空间上的距离关系;在2003年之后,随着3C技术的问世,在此后的十多年里,基于3C技术发展的技术陆续问世。
在这里插入图片描述
HiC技术的流程:
1). 首先,通过交联把细胞核内DNA的高级结构固定下来,再选择适合的酶作酶切;
2). 切断之后,在末端通过补齐把biotin的标记加到了切点的末端;
3). 近端连接(关键步骤):通过连接酶把线性距离较远而空间距离较近(9埃以内)的DNA片段连接起来,捕捉到了空间距离较近的信息;
4). 打断DNA,解除交联,加入DNA末端切割酶,切掉游离DNA上的生物素,通过Biotin的pull down,只得到嵌合片段;
5). 加adapter后进行测序
文库构建成功的关键是:PE片段的reads1和reads2分别来自不同基因组酶切片段;
同时为了消除试验操作对原本基因组的互作的干扰作用,要作对照!
在这里插入图片描述
以Hic-pro为例:
1). 测序得到的reads是嵌合体DNA,中间的结合区域来自于所使用的酶;
2). mapping时reads1和reads2分开比对,然后再merge到一起得到交互信息,mapping时调用bowtie 进行全基因组的比对;
3). HiC的数据均只选取unique reads 进行下游分析:这是HiC的作用决定的,最终得到的数据是基因组上不同区域在空间上的临近概率,若计算那些比对到多个位置的信息对后续空间临近概率的计算造成误差;
4).在mapping的时候会发生错误或mapping到多位点,需要一定的策略来提高unique reads 的比率:一种是迭代加长mapping的方式,从序列最前端取25-30bp的碱基先行mapping,当发生多重比对的时候再向后延伸5bp继续比对,一直比对到中间的酶切位点,目标就是达到最高的唯一比对率; 第二种mapping的策略则是迭代缩减的方式;
5).将reads1和reads2 merge到一起,筛掉只有一个reads比对上的、两个reads比对到多处的、两个reads都没能比对上的、reads的质量较低的;
6). 对参考基因组以所选的酶作一个片段的分配,比如最开始建库时选的HindⅢ,以其为酶切位点在全基因组上将他们分为一段一段的DNA片段,则获取的就是这些片段的互作信息;
7). a中这种来自基因组上很远位置的片段就可以反应基因组的互作信息;b中的contiguous是原位的,无意义;c自连环化;d没有进行连接,只有捕获,有一个biotie;e捕获成功,甚至没有生物素;f测序引入的PCR冗余;g错误的长度,d1+d2的长度超出了设定的阈值;
8). 现有的HiC分辨率还比较低(只能得到一段序列与一段序列的互作,而无法得到一个bp与一个bp的互作),将基因组按照500kb分bin,则可以得到的是某一横坐标和某一纵坐标下有这么多对reads支持这两个bin之间的互作程度,此矩阵再进一步标准化[缩小过高的数据与过低的数据之间的距离,使得展示更加平衡,使得数据每一行和每一列的数值相等]后可作HiC的热图;

文章解析

表型分析

在这里插入图片描述
比较了二倍体与其同源四倍体的表型差别:同源四倍体叶子数目增加,开花时间推迟,抗逆性增强;
转录组分析表明:436个上调基因,307个下调基因。

  • HiC分析

CT层次

在这里插入图片描述

  1. 细胞学的方法向野生型和同源四倍体转化HTR12(着丝粒特异的组蛋白H3标记)的GFP,分别统计了他们保卫细胞的着丝粒数量,四倍体与野生型之间呈现二倍关系,从一开始就在细胞学上明确了加倍后的同源四倍体没有出现着丝粒的融合,且在染色体疆域层次上是相对独立的。A B
  2. HiC的矩阵热图:分别作出Col-0和4XCol-0的矩阵,再四倍体除以野生型,得到倍性与染色质互作的关系图。图上的每一点代表了一个bin的距离(50kb),cis互作代表chr2对chr2的互作,trans代表的则是chr2和chr4之间的互作,在结合红高蓝低的数值,可以得出:同源四倍体染色体内部相互作用减少,染色体之间的相互作用增加。C
  3. 分别计算野生型和四倍体的trans/cis 数值,换个角度比较,四倍体显著高于野生型。D
  4. 进一步地,染色体内的互作分布:互作程度随着基因组的距离增加而降低。E 在同一染色体内部,同源四倍体的近着丝粒区域和近端粒区域的互作都低于野生型 F ----都反映了四倍体的较近染色体的互作降低了。
  5. 以另一种维度分析了臂内、臂间和不同染色体间的互作(背景里介绍了着丝粒似绝缘体隔断了两个臂之间的相互作用,那这里说的臂间我便理解为姐妹染色单体两个同侧臂之间的关系): 同源四倍体臂内互作频率较低(G),臂间无明显变化(H),染色体间的互作增加(I,在附图里有详细列出每一对染色体之间的互作比较,I的数据是每一组数据的加和结果);
  6. 结论:同源四倍体染色体间互作增加,染色体内部互作减少
  7. 解释:同源四倍体核体积增加了1.7倍,而不是2倍,与本文结论互为加持:同源四倍体中染色体之间的互作增加导致了染色体更加紧实,形成更小的核。

区室层次

在这里插入图片描述

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值