之前给大家介绍了一篇微生物组学建模方法的综述,其中提到了我们还可以利用宏基因组学数据来计算细菌的复制速率。这个点子还是蛮有意思的,所以就花了点时间探究了下,本文即是我的学习笔记~
知识背景
根据细菌环状 DNA 复制的原理,从复制起点到终点的平均基因组拷贝数会逐渐减少。我们可以通过计算整个基因组中的 DNA 测序覆盖率的变化,来检测这种趋势。
我们可通过 GC skew 和基因组覆盖度估计细菌基因组上的复制起点和终点。
GC skew:GC skew 的计算公式为
(nG-nC)/(nG+nC)
,其中 nG(nC)为特定大小 DNA 片段(窗口)中 G 或 C 的含量。GC skew 在染色体复制起始位点、终止点产生明显的由负到正、由正到负的变化。该方法是 1996 年由 Lobry 通过对大肠杆菌、枯燥芽胞杆菌和流感嗜血杆菌 3 种细菌基因组的分析发现它们DNA链不同区域的核苷酸组成不对称而建立的,即前导链含有较多的 G,而后随链含有较多的 C。因为 DNA 链在复制起点 oriC 处改变其从后随链到前导链的复制模式,所以在 oriC 处会发生 GC skew 由负到正的变化。该现象随后被其他研究人员在很多细菌研究中证实,此方法进而广泛应用于细菌染色体复制起始位点的判断。造成这种现象的原因主要是由于在前导链和后随链上选择和突变压力的不同。
细菌中环状 DNA 的复制过程
2015 年的 Science 文章中 Korem 等人利用了复制起点测序覆盖度与复制终点测序覆盖度的比值来估计细菌的复制速率。复制起点和终点分别对应于覆盖度的峰和谷,因此作者将他们的方法命名为 PTR (peak-to-trough ratio)。他们应用 PTR 计算了人类微生物群中特定细菌的复制率。但这种方法的局限性在于需要细菌的完整参考基因组。而目前绝大多数细菌仍未培养,也缺乏相应的参考基因组。
紧接着,2016 年发表于 Nature Biotechnology 上的文章又提出了一种新的方法,这种方法可以使用组装的细菌基因组草图进行菌群复制速率的分析,名为 iRep(Index of Replication)。其解决了 PTR 只能计算有参考基因组的细菌的限制,适用范围更广,适应更多环境样本。