如何做组间差异检验_基于距离的差异检验方法

2602c6b34dbc1af0b50efad709a0d78a.gif 简单总结一下常见的基于距离的差异检验方法 cfeef11ccaf8074d7971a3678e653311.gif 常规的 T 检验、方差分析等,可以用于比较组间变量的差异水平。由于这些常规方法都是对于 1-2 个特定变量而言的,那么如果我们想比较所有变量整体的差异,或者说各组对象间在变量组成上是否存在较大的不同,应该怎样做呢? 多变量情形下,可能会首先想到使用 PCA 等排序分析方法去降维,然后在低维空间的排序图中观测对象的离散程度,组间区分是否明显等。 然后我们首先看下面这个 PCA 。 排序图中,显示 setosa 与 virginica 或 versicolor 之间区分明显, virginica 和 versicolor 之间存在一定程度的重叠。这种组间的区分程度是我们直接通过眼睛观测的,那么,通过观测的评估是否是准确的?比方说, setosa 与 virginica 或 versicolor 之间在变量组成上是否真的存在显著差异呢?类似地, virginica 和 versicolor 在 PCA 图中区分不明显,那么它们真的无区别吗(是否存在潜在差异)? d0cd544fc38fa78c52588aa1e92ea07b.png

由于PCA只是探索性分析,用于描述数据分布,不涉及统计检验,因此无法给出一个指标(如p值)作为我们评估组间差异程度的标准。尽管很多情况下可能并不需要,但如果存在必要,我们还需结合其它方法用作评估。

这里就需要考虑特定的统计检验方法,用作组间差异分析。

对于多变量情形下的组间差异分析,可能首先会想到多元方差分析(MANOVA)。然而,MANOVA的有效性取决于严格的前提假设,如多元正态性、方差-协方差矩阵的同质性等,导致在实际情况中大部分案例都是直接拒绝的,因此MANOVA不具普适性。考虑到这一点,统计学家们已经提出了许多方法替代经典的MANOVA,它们在比较多变量的组时更为稳健,并得到了广泛应用。

其中一些方法并非直接通过原始的变量作比较,而是首先基于多变量计算对象间的“距离”,然后将距离测度用作检验的输入,进而确定各组对象间的差异程度。这类方法通常称为“基于距离的检验方法”(Distance‐Based Tests),常见的如置换多元方差分析(PERMANOVA)、相似性分析(ANOSIM)、Mantel test等。

好了,到这里就开始接本篇的正文部分了,简单地对这些常见的基于距离的检验方法作个概述。

  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值