物种研究作为微生物群落分析的核心内容,在数据分析、文章写作中都占有非常高的比重。大家最常用的物种分析方法,比如统计检验、lefse等;最常用的可视化形式,比如堆叠图、热图、盒型图等。但其实物种之间并不是独立存在的,群落中的细菌内部、真菌内部、细菌与真菌之间由于竞争、协同等直接/间接关系,物种间存在着千丝万缕的联系。所以,一篇16S/ITS/宏基因组的深度好文,怎么可以少了物种关系分析呢?
网络图是呈现物种关系最直观高大上的可视化形式。文章中的网络图样式大同小异,但是文章中物种网络图的名称可是多种多样,构建物种关系的方法更是千差万别。
昨天的《如何绘制漂亮的网络图?》一文已经介绍过如何绘制网络图,今天,我们就详细聊聊常见的物种关系网络图的构建方法。
物种关系网络构建方法
对于一片未知的微生物群落,难以实现分离培养和实验观察,所以想知道物种关系就需要借助生物信息分析方法进行物种关系的预测,进而得到绘制网络图的数据。
基于物种丰度表格,物种关系的构建主要有以下几种方法,不同方法各有千秋,接下来我们详细对比看看。
表1 物种关系网络构建方法汇总
1. 相关系数法
(1)特色:首先,最简单基础的,就是相关系数法,在文献中也有着广泛应用。
以主流的pearson和spearman两种相关系数为例,二者主要通过物种在不同样本中相对丰度的变化,基于变化趋势的线性相关程度,如同增、同减等特征计算两两物种间的相关系数,取值[-1,1]。最后可通过Fish-Z变换等方法计算相关显著性P值。一般结合相关系数和P值筛选数据后绘图。
二者的区别在于,pearson是基于原始数据进行相关系数的计算,spearman是基于丰度的排名进行计算。所以pearson直接反映数据线性相关程度,对数值更敏感;spearman会弱化数据的具体大小,更专注反映整体趋势。
(2)工具:R语言psych包、Omicshare tools”组内相关性分析”工具(图1)。
图1 OS小工具
2. MENA法