非参数统计检验：Kruskal-Wallis H检验和Friedman检验

powerelectricdog

于 2025-04-10 16:23:26 发布

阅读量466

点赞数 5

文章标签：非参数统计检验 Kruskal-Wallis H检验 Friedman检验独立样本配对样本

本文链接：https://blog.csdn.net/weixin_36300623/article/details/147152761

版权

非参数统计检验：Kruskal-Wallis H检验和Friedman检验

背景简介

在统计分析中，我们经常需要比较多个样本组的分布是否存在显著差异。传统的ANOVA（方差分析）检验在数据不满足正态分布或方差齐性等参数检验假设时，其结果的可靠性会受到影响。非参数统计检验方法，如Kruskal-Wallis H检验和Friedman检验，提供了另一种有效的比较方式，尤其适用于样本量较小或数据不满足正态分布的情况。

Kruskal-Wallis H检验

Kruskal-Wallis H检验是一种用于比较两个或多个独立样本数据分布的非参数方法。其默认假设（零假设）是所有样本均来自同一分布，即所有组的总体中位数相等。拒绝零假设意味着至少有一个样本与其它样本存在显著差异，但并不指明具体是哪些样本或差异程度。

检验步骤

假设检验：提出零假设（H0）和备择假设（H1）。
计算检验统计量：使用kruskal()函数计算出的H值。
确定显著性：通过比较p值与显著性水平α来判断是否拒绝零假设。

应用案例

通过Python示例代码，生成三组独立样本数据并进行Kruskal-Wallis H检验，得到统计量和p值，并据此作出统计推断。

# Python代码示例
from numpy.random import seed
from numpy.random import rand
from scipy.stats import kruskal

seed(1)
data1 = 50 + (rand(100) * 10)
data2 = 51 + (rand(100) * 10)
data3 = 52 + (rand(100) * 10)
stat, p = kruskal(data1, data2, data3)
print(f"Statistics={stat:.3f}, p={p:.3f}")

Friedman检验

Friedman检验适用于重复测量或成对样本数据。其零假设是所有成对样本具有相同的分布，拒绝零假设意味着至少有一个样本与其他样本存在显著差异。

检验步骤

数据准备：确保数据为成对样本。
计算检验统计量：使用friedmanchisquare()函数计算出的卡方值。
判断差异：通过p值判断是否拒绝零假设。

应用案例

同样使用Python代码进行Friedman检验，通过成对样本数据来判断是否存在显著差异。

# Python代码示例
from numpy.random import seed
from numpy.random import rand
from scipy.stats import friedmanchisquare

seed(1)
data1 = 50 + (rand(100) * 10)
data2 = 51 + (rand(100) * 10)
data3 = 52 + (rand(100) * 10)
stat, p = friedmanchisquare(data1, data2, data3)
print(f"Statistics={stat:.3f}, p={p:.3f}")

总结与启发

Kruskal-Wallis H检验和Friedman检验是处理非正态分布样本的有力工具。通过这些方法，研究者可以在不满足传统参数检验假设的情况下，对数据进行有效的比较分析。它们是现代数据科学中不可或缺的分析手段，尤其是当数据集规模较小或者样本特征不符合正态分布时。掌握这些方法，有助于我们更准确地把握数据特征，为决策提供科学依据。

通过本文的介绍，读者应能对如何运用Kruskal-Wallis H检验和Friedman检验有更深入的理解，并能够在实际问题中根据数据特点选择合适的检验方法。未来，我们还可能探索更多与这些检验相关的统计方法，比如事后多重比较测试，以进一步细化差异分析。