文献阅读 | 利用体细胞的mtDNA的突变追踪细胞的分化命运

文献来源:https://doi.org/10.1016/j.cell.2019.01.022

对文献思路进行注释,就是把书读厚的过程。

1、文章的研究背景(我们要研究什么?目前的研究困境是什么?期待的结果是什么?)

人体中所有的细胞都起源于受精卵(zygote),但是我们对于细胞分裂与分化的具体过程并不了解。因此,我们对于特定组织中特定的生理或者病理过程中细胞的动态变化了解甚少。

*我们想得到什么?

基于基因的表达以及表观遗传的信息,了解到细胞的类型以及细胞所处的生物学状态

*目前研究细胞分化的实验方法:

(1)用遗传标签标记单个细胞:如荧光报告基因,高度多样性的DNA条形码文库,可移动的转座元件,Cre介导的重组,基于CRISPR的遗传疤痕。

(2)单细胞测序

  • 目前有限的谱系追踪的文章都研究了啥?
  • 体细胞突变的发现(单核苷酸位点的突变,拷贝数目的变异,短的串联重复序列的变异),这些突变稳定的遗传到子细胞中,但是在“亲缘关系”较远的细胞中缺失。

*为什么用体细胞的mtDNA的突变而不用体细胞的核基因的突变?

体细胞的核基因突变:具有较高的错误率(high error rates),很贵只能应用于有限的规模(limited scale),以及并不能有效的捕捉细胞状态信息(cell state information)。

体细胞的mtDNA的突变:有大量可供研究的变异,小价格负担的起,线粒体DNA突变率相较于核基因而言更高,已有研究间接表明mtDNA的突变在不同组织中用于克隆追踪的可能性。

*这篇文献创新的一个地方:

在一般的单细胞测序数据的分析过程中,我们通常把线粒体基因组当做是数据的噪声(要被去除的,内源的参照),但是这篇文献中尝试把线粒体DNA用起来,去追踪细胞的分化层次关系(证明!它可以!)。

依据:

(1)在单个细胞中,线粒体DNA可以被可靠的检测到。

(2)可以稳定的遗传到子细胞中。

(3)可以被用于精确地确定遗传关系。

(4)可以和细胞状态的测量方法结合。

(5)应用于研究人类样本。

2、ATAC-seq与Chip-seq的区别是什么?

ATAC-seq(assay for transposase accessible chromatin):一种表观遗传学的研究技术。用转座酶切割特定时空点上开放的染色质区域(为何开放?因为此处有转录事件的发生?涉及到调控过程与表达过程。),获得该时空位点上活跃转录的染色质序列。【参考链接http://www.genecreate.cn/ATAC-seq/

Chip-seq(Chromatin Immunoprecipitation):Chip是染色体免疫共沉淀技术的简称,Chip-seq则将染色体免疫共沉淀技术与第二代测序技术有机的结合起来。通过染色体免疫共沉淀捕捉到与特异性的转录因子结合的序列信息,然后将这部分序列进行测序分析,从而鉴别特定转录因子与基因组的作用特征。【参考链接https://www.cn-healthcare.com/articlewm/20200427/content-1108155.html

根据对上述概念的梳理,那么我觉得Chip-seq与ATAC-seq之间的异同可以体现在以下方面:

相同点:都是表观遗传学的研究技术,探究转录的过程中,染色体与特定的转录因子的结合情况。

不同点:(1)ATAC-seq解决的是特定时空点上,染色质整体的开放问题。

              (2)Chip-seq则针对于特定的转录因子而言,探究转录因子与基因组的结合模式,可能是不同的时空点条件下。

3、关于发育生物学的一些名词

谱系定向(lineage commitment):使用遗传手段对表达特定标记基因的祖细胞亚群进行标记,在后续时间点对其分化命运进行检测。【参考链接zhuanlan.zhihu.com/p/133861128

细胞分化(Cellular differentiation):指同一来源的细胞逐渐产生出形态结构、功能特征各不相同的细胞类群的过程,其结果是在空间上细胞产生差异,在时间上同一细胞与其从前的状态有所不同。细胞分化的本质是基因组在时间和空间上的选择性表达,通过不同基因表达的开启或关闭,最终产生标志性蛋白质。【参考链接https://baike.baidu.com/item/%E7%BB%86%E8%83%9E%E5%88%86%E5%8C%96

4、理解文章中用到的每一张图。

(1)这一个组图是要说明:线粒体突变在人类细胞中是稳定遗传的。


每一个细胞中有若干个线粒体。而每个线粒体中又有若干个线粒体DNA的拷贝。随着时间的积累,这些线粒体DNA会发生突变,并在谱系间传递。

 补充知识点:

  • 线粒体DNA复制
  • 线粒体复制

原理验证试验:从TF1细胞以及TF1细胞子代提取mtDNA,进行ATAC-seq分析。

 

构建的一个谱系树,一共传了8代。每一代大概是3个星期。

 

A图表示ATAC文库中 线粒体基因的覆盖率的平均值达3264。每一柱代表上述谱系图中的每一个细胞。颜色表示细胞同一母系来源。
B图,计算了一个Pearson相关系数为0.99996(非常显著相关),比较的对象则是重复测序的细胞样本的高显著突变出现的频率的平方根。 显示出线粒体突变能够被ATAC-seq技术稳定的检测到。
C图,有三种不同颜色的峰,横坐标为碱基的质量,纵坐标为密度。即对碱基的测序质量进行了一个统计,峰值代表大多数碱基质量的集中值。蓝色线代表高测序质量的突变。
灰色的纵线代表高置信度变异分布的99%概率阈值(统计学我没怎么学明白,每一步图如何绘制,用到哪些数据,我不太明白)。

*如何理解测序质量?(包括测序质量如何被计算?测序质量的生物学意义是什么?)

 

这一步得到的结果是什么?我们从中选取出具有高置信度异质性的线粒体基因型用于下一步的研究。


 

左侧:前面已知的细胞分化的谱系图。
右侧:高显著性的mtDNA的变异的参差聚类图。这些高显著性的mtDNA的突变是上一步筛选出来的。

 

这独特的编号8003C>T是突变的位点及其所对应的突变的类型。

在这一步骤当中,我们从高置信度的线粒体突变中筛选出,特殊的细胞谱系唯一的突变类型。


E:使用高置信度的mtDNA的突变来重构细胞样本之间的克隆关系。层次聚类能够将所有亚系正确的归类到同一个克隆家族。
F:最近的共同祖先(MRCA)的识别。between clone细胞之间96%,within clone细胞间79%。
(其实也好理解,between clone细胞之间相比于within clone而言相隔了一代,容易区分出来很正常。)
 

*MRCA分析是什么?在谱系追踪中的价值?

MRCA:最近共有祖先。对三个进行分析以确定具有共同祖先的一对(由同一个节点延伸而来)。

一个指标,用于评估谱系重建树的精度。因为重建的过程是通过筛选得到的高置信度的mtDNA突变而实现的,所以这一步就相当于评估mtDNA能否用于重建谱系树?精确度如何?(猜测是用测试集做的,已知谱系分化关系)

解释一下专有名词的意思。如下图E中所示,Between clone指的是A,C,D细胞之间。within clone指的是B,C,D细胞之间(所以英文单词只是一个单词的区别,意思就变了)。显然C,D具有共同的祖先,但是我们就是要看使用我们上述的方法是否能够精确的判断出来。

 

F:推断了每一类细胞占总体的比率。Experiment代表已知的比例,inferred代表推断的值,通过两者比较,可见推断的平均偏差。
合成样本的反褶积(这个术语我没怎么听懂)。

 这一步骤总体在说明,用高置信度的线粒体DNA的突变类型重建谱系发育树的可靠性(用已知的测试集在评估)。


这一环节企图将线粒体基因组的基因型与染色质状态联系起来(不太明白为什么?一个是线粒体的基因,一个是核基因上的情况?是不是说线粒体基因能够将细胞分类,而不同类型的细胞,其特定的基因的表达应该是相似的。从这一方面去想的话,实在是好间接啊)。

染色质状态是否具有可遗传性?那这些持开放状态的基因,我觉得应该是奢侈基因,不是简单的传代增殖了,而是分化的过程已经产生了。那其实这篇文章研究的就是,在细胞分化的过程中,通过线粒体DNA的突变构建谱系树。而在谱系树构建的过程中,染色体状态具有可遗传性(调查的91607个peaks中,8570个peaks具有高度的可遗传性,即与谱系的发育过程相关。这些peaks一般是奢侈基因的位点)。

接下来我们将线粒体基因型与染色质状态配对
每个克隆的信息,并确定了不同的染色质状态,遵循推断的克隆关系。我们近似于成对克隆的线粒体相关性
(图1G;星方法),
并执行了随机效应
每个染色质可及性峰的方差分解
在我们的TF1克隆中(图1H),询问染色质的“遗传”程度
特征存在于总体中。在测试的91607个峰中,8570个峰
高度遗传(>90%方差解释;图1I和
S1G)。
 

 

G:变异成分模型(为啥要有这个奇怪的东西的存在?)。

总的来说,这说明了ATAC seq对于mtDNA基因分型,以实现准确的克隆追踪,同时提供细胞状态信息。


(2)这一组图要说明:用单细胞基因组(Single Cell Genomics)可以检测到线粒体DNA的突变。

6种主流的单细胞转录组测序技术:CEL-seq2Drop-seqMARS-seqSCRB-seq、Smart-Seq/C1、Smart-Seq2。这6种测序方法的主要区别是,Smart-Seq/C1、Smart-Seq2   是一种全长(full-length)的测序方法,而其他则只是测量部分(?)。

图源 https://marlin-prod.literatumonline.com/cms/attachment/a5684cb0-1c39-4a46-be93-be5a90c678e8/gr2.jpg
展示的是这六种常用的测序方法的实验流程。

 

探究的是这些测序方法能够对线粒体DNA的覆盖率。

从图中我们可以发现,Smart-seq/C1、Smart-seq2这两种方法的表现普遍较好。可以在低测序深度下,得到较高的线粒体DNA的覆盖率。

从图中可以得到一些只发生在RNA上的突变类型。如1672A>G位点,在DNA上很少会发生突变,频率为0,然后在RNA水平上,突变率达到1。

DNA与RNA的突变具有一致性,但是仍然发现一些突变为RNA所特有,比如已经被实验证实的1672A>G的RNA位点的突变(可能受基因编辑影响)。但是大多数的RNA突变是非常低频的,在0.2以下(转录错误或者测序错误)。

也就是通过这一步来证明,大部分mtRNA的突变与mtDNA的突变具有一致性,所以通过对RNA的测序分析(因为我们进行的单细胞RNA测序),可以建立起mtDNA突变与表型的关系。我们测到的RNA的突变可以忠实的反映DNA的突变。


(未完成,临时改变研究方向)

2021/4/26

 

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值