区域生长算法_利用宏基因组数据估计细菌生长速率

本文介绍了如何利用区域生长算法,如iRep和bPTR,从宏基因组数据中计算细菌的生长速率。iRep适用于无完整参考基因组的情况,而bPTR则需要完整的参考基因组。DEMIC作为另一方法,能处理高度片段化的contigs,适用于多样本分析。这些工具通过分析基因组覆盖度变化,为理解微生物群落的生长动态提供了有力手段。
摘要由CSDN通过智能技术生成

之前给大家介绍了一篇微生物组学建模方法的综述,其中提到了我们还可以利用宏基因组学数据来计算细菌的复制速率。这个点子还是蛮有意思的,所以就花了点时间探究了下,本文即是我的学习笔记~

知识背景

  1. 根据细菌环状 DNA 复制的原理,从复制起点到终点的平均基因组拷贝数会逐渐减少。我们可以通过计算整个基因组中的 DNA 测序覆盖率的变化,来检测这种趋势。

a8132b3d64aec499ab22370a6ca8625e.png
  1. 我们可通过 GC skew 和基因组覆盖度估计细菌基因组上的复制起点和终点。

GC skew:GC skew 的计算公式为 (nG-nC)/(nG+nC),其中 nG(nC)为特定大小 DNA 片段(窗口)中 G 或 C 的含量。GC skew 在染色体复制起始位点、终止点产生明显的由负到正、由正到负的变化。该方法是 1996 年由 Lobry 通过对大肠杆菌、枯燥芽胞杆菌和流感嗜血杆菌 3 种细菌基因组的分析发现它们DNA链不同区域的核苷酸组成不对称而建立的,即前导链含有较多的 G,而后随链含有较多的 C。因为 DNA 链在复制起点 oriC 处改变其从后随链到前导链的复制模式,所以在 oriC 处会发生 GC skew 由负到正的变化。该现象随后被其他研究人员在很多细菌研究中证实,此方法进而广泛应用于细菌染色体复制起始位点的判断。造成这种现象的原因主要是由于在前导链和后随链上选择和突变压力的不同。

baed2ab373d688e3d8d1ac8e8b1b3175.png

细菌中环状 DNA 的复制过程

2015 年的 Science 文章中 Korem 等人利用了复制起点测序覆盖度与复制终点测序覆盖度的比值来估计细菌的复制速率。复制起点和终点分别对应于覆盖度的峰和谷,因此作者将他们的方法命名为 PTR (peak-to-trough ratio)。他们应用 PTR 计算了人类微生物群中特定细菌的复制率。但这种方法的局限性在于需要细菌的完整参考基因组。而目前绝大多数细菌仍未培养,也缺乏相应的参考基因组。

ef287056b66b01c454f55701d6c88317.png

紧接着,2016 年发表于 Nature Biotechnology 上的文章又提出了一种新的方法,这种方法可以使用组装的细菌基因组草图进行菌群复制速率的分析,名为 iRep(Index of Replication)。其解决了 PTR 只能计算有参考基因组的细菌的限制,适用范围更广,适应更多环境样本。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值