rda分析怎么做_群落分析的冗余分析（RDA）概述

最新推荐文章于 2024-04-21 13:08:21 发布

法律硕士长风师兄

最新推荐文章于 2024-04-21 13:08:21 发布

阅读量1.9w

点赞数 14

文章标签： rda分析怎么做

本文链接：https://blog.csdn.net/weixin_34858011/article/details/112901922

版权

冗余分析(RDA)是一种约束排序方法，用于研究环境变量如何影响群落物种组成。它结合多元回归与PCA，通过分析响应变量(物种多度)与解释变量(环境因子)之间的关系，揭示环境因素对群落结构的约束。RDA包括基本方法、偏RDA、db-RDA，并可通过不同标尺解读排序结果，理解环境变量的贡献和物种间的关系。

摘要由CSDN通过智能技术生成

约束排序之冗余分析(RDA)概述

前篇先后简介了主成分分析(PCA)、对应分析(CA)、主坐标分析(PCoA)以及非度量多维尺度分析(NMDS)。这些排序方法均属于非约束排序，只涉及一个数据矩阵，并在低维空间中尽可能呈现原始的数据结构。非约束排序方法中不存在解释变量(对于物种多度数据而言，解释变量通常指代环境因素)，尽管可以通过相关性或多元回归的方式被动添加至排序空间中。与此相比，约束排序则可以从排序开始直接加入解释变量进行运算，它涉及两个数据矩阵，响应变量矩阵以及解释变量矩阵。本篇继续以群落分析为例，对约束排序方法之一的冗余排序(RDA)作个简述。

RDA的基本方法描述

冗余分析(RDA)和基于转化的冗余分析(tb-RDA)

Rao(1964)首次提出冗余分析(Redundancy analysis，RDA)，从概念上讲，RDA是响应变量矩阵与解释变量矩阵之间多元多重线性回归的拟合值矩阵的PCA分析，也是多响应变量(multi-response)回归分析的拓展。在群落分析中常使用RDA，将物种多度的变化分解为与环境变量相关的变差(variation；或称方差，variance，因为RDA中变差=方差；由约束/典范轴承载)，用以探索群落物种组成受环境变量约束的关系。

包含很多零值的物种多度数据在执行多元回归或其它基于欧式距离的分析方法之前必须被转化，Legendre和Gallagher(2001)提出的基于转化的RDA(Transformation-based redundancy analysis，tb-RDA)用于解决这个问题。tb-RDA在分析前首先对原始数据做一定的转化(例如Hellinger预转化包含很多零值的群落物种数据)，并使用转化后的数据执行RDA。即除了第一步增添了数据转化外，其余过程均和常规的RDA相同，只是在原始数据本身做了改动，RDA算法本质未变。

RDA算法可以简要总结如下(详细过程可参阅Legendre和Legendre(1998)“Numerical Ecology”，579-584页的内容)。其中矩阵Y是中心化的响应变量矩阵，X矩阵是中心化(或标准化)的解释变量矩阵。RDA中通常使用标准化后的解释变量，因为在很多情况下解释变量具有不同的量纲，解释变量标准化的意义在于使典范系数的绝对值(即模型的回归系数)能够度量解释变量对约束轴的贡献，解释变量的标准化不会改变回归的拟合值和约束排序的结果。在群落分析中，响应变量矩阵一般即为物种多度数据，解释变量矩阵即为环境变量数据。

(1)先将矩阵Y中的每个响应变量分别与矩阵X中的所有解释变量进行多元回归，通过回归模型获得每个响应变量的拟合值(fitted values，即在回归线上对应的值)以及残差(residuals，响应变量的观测值和拟合值之间的差值)，最终得到包含所有响应变量拟合值及残差的拟合值矩阵Ŷ以及残差矩阵Yres)。

(2)对拟合值矩阵Ŷ运行PCA，得到典范特征向量(eigenvectors)矩阵U。使用矩阵U计算两套样方排序得分(坐标)：一套使用中心化的原始数据矩阵Y获得在原始变量Y空间内的样方排序坐标(即计算YU，所获得的坐标称为“样方得分”，即物种得分的加权和)；另一套使用拟合值矩阵Ŷ获得在解释变量X空间内的样方排序坐标(即计算ŶU，所获得的坐标称为“样方约束”，即约束变量的线性组合)。

(3)一般来讲，RDA过程执行到上步就算完成了。但一般情况下我们会同时对残差矩阵Yres运行PCA，获得残差非约束排序。非约束轴即代表了解释变量未能对响应变量作出解释的部分，严格地来说不属于RDA的范畴，但能够帮助我们获取更多信息。

Zelený博士使用仅包含一个解释变量(环境变量)的数据形象化地展示了RDA过程(原文：https://www.davidzeleny.net/anadat-r/doku.php/en:rda_cca)。

(1)执行物种spe1与环境变量env1的线性回归(由于此处示例中仅存在一个环境解释变量，故此回归为一元线性回归；当存在多解释变量时，即为多元线性回归)，将回归模型拟合的物种丰度值存储在拟合值矩阵，物种丰度的残差存储在残差矩阵。见下图1中所示的过程。

(2)如此对物种组成矩阵中的所有物种重复相同的操作，最终获得包含所有物种丰度拟合值及残差的两个矩阵。见下图2中所示的两个矩阵。(1)(2)过程即形象化地展示了RDA中的回归细节部分。

(3)回归过程执行完毕后，使用PCA，在拟合值矩阵中提取约束的排序轴，并在残差值矩阵中提取非约束的轴。见下图2中所示的过程，在该示例中，由于仅有一个解释变量(环境变量env1)，因此仅得到一个约束的排序轴(排序图中的垂直轴是第一个非约束轴)。

RDA排序结果产生的约束轴的数量为min[p, m, n - 1]；如果同时获得非约束排序结果(即PCA)，则非约束轴数量为min[p, n - 1]。其中，p为响应变量数量；m为定量解释变量数量以及定性解释变量(因子变量)的因子水平的自由度(即该变量因子水平数减1)；n为排序对象数量。

偏冗余分析(偏RDA)