微生物网络构建原理: SparCC, MENA, LSA, CoNet

主要参考这个网站,是由CoNet的作者写的(点阅读原文直达)。

http://psbweb05.psb.ugent.be/conet/microbialnetworks/index.php

Microbial association network construction tutorial

Image

Image

Image

宏基因组公众号之前对该网站进行了翻译整理:

微生物相关网络构建教程:MENA, LSA,SparCC和CoNet

Image

Image

但是后来网站又增加了新的方法SPIEC-EASI。

另外他们还做了一个介绍网络方法的PPT,可以在网站上直接下载。也可以在我公众号里回复“网络”获取pdf链接。

Image

在网站的Resources中有所有方法的参考文献,可根据需要自行阅读。

Image

下面对PPT的内容进行简单介绍。核心内容如下:

Image

Image

Begin

Image

背景

Image

微生物之间的共现(Co-occurrence)可能有以下几种原因,他们可能具有一定的生态关系,或者在生态位上有重叠。

Image

Image

物种的关系可能是此消彼长、或者共增共减。

Image

Image

Image

实现网络的技术及存在的问题

Image

目前有两种实现网络的技术,第一种是基于相似性。

不管是基于abundance还是incidence的数据,都可以计算成对物种之间的相似度矩阵,并随机化数据反复计算。

考察实际相似度与打乱后相似度的显著性差异。

最后保留具有意义的相似度并可视化。

Image

Image

其存在的问题包括:

1.双零问题(double zeros): 

微生物数据存在很多的0值。但是我们不知道该物种是低于检测限还是真的不存在。

因此当存在很多0,就会得到很高的相似度。

如下表所示,增加了0值后相似度显著的升高了。

因此对于双零值,算法中要避免得到很高的相似度。

Image

Image

Image

Image

2. 群落组成的问题:

由于每个样本测序深度不同,因此即使物种个数相同,所占比例也不同。因此需要标准化,可以用每个样本物种的个数除以总样本物种的个数;或者重抽到相同深度。

另外pearson和 spearman考虑的是绝对值,因此标准化后会带来很大的偏差。而基于比例或者对数比例(log-ratio)的方法不受数据组成的影响,因为标准化后数据之间的比例不会变。具体如下图所示,标准化后pearson相关性改变了。

Image

Image

第二种实现网络的技术是基于回归。将物种划分为source和target,使用多元回归计算物种之间的关系。

也是要随机化数据重复计算。根据实际回归系数与随机得到的回归系数的关系进行判定。

其优点在于可以检测多个物种的关系;并可以预测不对称的关系(如偏利共生)。

缺点在于会出现假阳性、过拟合,且难以可视化。

Image

Image

Image

实现网络的工具

Image

SparCC

SparCC使用对数比例的方差来计算物种之间的相关性。

Image

SparCC 对观测到的数据拟合狄利克雷分布,对物种的比例及相关性计算迭代计算多次。最后得到的相关性为分布的中位数。P值采用bootstrap方法计算。

SparCC是基于Python的软件,详见

https://bitbucket.org/yonatanf/sparcc/src/default/

Image

MENA

Molecular ecological network analysis pipeline

Image

其核心在于随机矩阵理论(Random matrix theory, RMT)。

计算给定阈值的pearson相关矩阵的特征值间距分布;

对于整个阈值范围都进行计算;

保留分布由高斯分布变为泊松分布的阈值;

保留阈值以上的所有相关性。

Image

Image

LSA

Local similarity analysis

计算时间序列之间的相似性。由于考虑了滞后效应,可以得到直接连接和不直接连接的边。这种方法在海洋和湖泊宏基因组中很受欢迎。基本计算原理和基于相似性的网络相同,只是将相似性按照时间进行了分割。

Image

CoNet

基于组合效应(Ensemble-based)的网络

不同相关性计算方法(pearson,spearman,bray-curtis)可表达不同的关系,但是随着阈值的增加彼此的结果会趋同。

不同方法也会存在不同的错误,但是对于正确的结果却是一致的。

因此可将不同方法结合起来。

Image

Image

对于每条边和每种方法,分别计算permutation和bootstrap分布。两者相比较得到最终的P值。

Image

Image

最后总结一下,四种方法各有特色:

MENA强项在于阈值的算法,且不需要人为设定阈值。

Sparcc特色在于相关性的计算方法。

LSA引入了时间序列。

CoNet将多种相关性综合考量。

  • 7
    点赞
  • 31
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
微生物是一类生物体,它们很小,只能在显微镜下才能看到。微生物包括细菌、真菌、原生动物和病毒等。它们在自然界中广泛存在且占据着重要地位。 微生物对人类和生态系统都有着复杂的影响。一方面,微生物可以产生酶和其他分子,帮助分解有机物并促进自然降解。此外,它们也可以参与植物养分循环,提供植物所需的营养物质。另一方面,一些微生物是人类的有益伙伴,比如肠道菌群中的益生菌可以帮助消化、促进免疫等。但是,也有一些微生物对人类和其他生物体有害,比如致病细菌可以引起疾病。 网络是由一系列节点和边组成的图结构。而igraph是Python中常用的一个网络分析工具包。使用igraph可以对网络进行建模、分析和可视化。 在微生物领域,网络分析可以帮助我们研究微生物之间的相互作用和组织结构。我们可以将微生物看作是网络的节点,而它们之间的相互作用可以看作是网络的边。这样一来,我们可以使用igraph来构建微生物网络,并对网络进行分析。 通过分析微生物网络,我们可以研究微生物之间的共生关系、竞争关系以及整体结构特征。这有助于我们更好地理解微生物群落的生态系统功能和稳定性,还可以为研究微生物的治疗应用提供参考。此外,网络分析还可以帮助我们发现网络中的关键微生物物种,了解它们在微生物群落中的重要作用。 总的来说,微生物网络igraph都是非常重要的研究领域。微生物的研究可以帮助我们了解生态系统的功能,而网络igraph可以帮助我们更好地理解和分析微生物之间的相互作用关系。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值