环境因子关联
在微生物群落研究中,我们通常都希望知道微生物群落变化是会受到哪些因素的影响,在这些因素中,什么因素是主要的影响因素?
回答这一问题需要将微生物群落数据与其对应的环境因子进行关联分析,在这一项分析中,使用最早也是使用频率最高的分析就是CCA/RDA。
CCA/RDA
CCA的全称是典范对应分析 (Canonical correspondence analysis),RDA的全称是冗余分析 (Redundancy analysis)。
CCA和RDA都属于排序分析,理论上其实和降维分析有点类似,都是尽量的将变量进行负责的整合,是的排在前几位的变量组合能够尽可能的解释更多的信息。
排序分析可以单独分析群落之间的关系,也可以分析群落与其环境之间的关系,只使用群落物种组成的排序分析成为间接排序,而使用物种和环境因子进行的排序分析成为直接排序。
CCA和RDA都属于直接排序分析,区别是使用的排序方法不一样,CCA使用的是单峰模型,而RDA使用的是线性模型。
CCA对应的间接排序方法是对应分析 (Correspondence analysis, CA),RDA对应的间接排序方式是主成分分析 (Principal components analysis, PCA)。
在间接排序中的结果中,坐标轴是分析变量也就是物种的复杂函数组合,而在直接排序中结果中,坐标轴是环境因子的复杂函数组合。
方法选择
我们在阅读文献的时候,会发现有的文章使用的是CCA,而有的文章使用的是RDA,那么对于初学者来说就会产生一种困惑,到底我是使用CCA还是RDA呢?
在进行排序分析之前,我们可以先对物种群落数据进行去趋势的对应分析 (Detrended correspondence analysis, DCA),根据结果中Lengths of gradient的数值来进行判断。
结果会给出4个Lengths of gradient的数值,如果其中最大的数值大于4,则应选择CCA,如果最大的数值小于3,则选择RDA,如果最大的数值在3-4之间,则两种分析方法都可以。
但是这种标准并不是100%合适,在实际的使用中,我们最好是同时进行CCA和RDA,根据结果进行选择。
在进行结果判断时,最主要是要看做出来的结果是否出现了“弓形效应”,比如下面这个图,样本点的分布想不想一个拉开的弓。(手头没有更好的弓型效应的结果了,大家凑合看一看吧)
一般来说如果环境因子的梯度范围较小,单峰模型和线性模型的结果差别不大,但如果环境因子的梯度范围较大,那线性模型就可能不太合适。
结果解释
CCA和RDA的结果图中使用点代表不同的样本,从原点发出的箭头代表不同的环境因子。
箭头的长度代表该环境因子对群落变化影响的强度,箭头的长度越长,表示环境因子的影响越大。
箭头与坐标轴的夹角代表该环境因子与坐标轴的相关性,夹角越小,代表相关性越高。
样本点到环境因子箭头极其延长线的垂直距离表示环境因子对样本的影响强度,样本点与箭头距离越近,该环境因子对样本的作用越强。
样本位于箭头同方向,表示环境因子与样本物种群落的变化正相关,样本位