Wilcoxon 检验之 rank-sum 与 signed-rank
觉得有用的话,欢迎一起讨论相互学习~
转载自:
https://blog.csdn.net/chikily_yongfeng/article/details/82255575
前些时候在写作时碰到了 Wilcoxon 检验,仔细一查,发现这里面居然还包含 2 种不同类型的检测,并且极容易混淆,这 2 种分别方法是 Wilcoxon rank-sum test(我翻译为秩和检验)和 Wilcoxon signed-rank test(我翻译为符号秩检验)。今天我简单总结一下,对比一下他们的差异。
Frank Wilcoxon (1892—1965) 是美国的统计学家,发表了 70 篇左右论文,但其最大的贡献就是这 2 个以他名字命名的非参假设检验方法:秩和检验 和 符号秩检验。他在 1945 年发表的论文 1 中将二者分别称为 非成对检验 (unpaired experiment)和 成对检验(paired comparison)。 正是因为其巨大影响力使得这两个检验方法都以他的名字命名,并流传下来。
1. Wilcoxon 秩和检验
根据 wikipedia 解释, Wilcoxon rank-sum test 定义如下,
In statistics, the Mann–Whitney U test (also called the Mann–Whitney–Wilcoxon (MWW), Wilcoxon rank-sum test, or Wilcoxon–Mann–Whitney test) is a nonparametric test.
This test can be used to determine whether two independent samples were selected from populations having the same distribution. 2
基本概念: 在统计学中,Wilcoxon rank-sum test(威尔科克森秩和检验)也叫 Mann-Whitney U test(曼-惠特尼 U 检验),或者 Wilcoxon-Mann-Whitney test。秩和检验是一个非参的假设检验方法,一般用来检测 2 个数据集是否来自于相同分布的总体。
这里的 “秩” 其实就是 “排名” 的意思,“秩和” 当然就是指 “将排名进行求和” 的操作。在秩和检验中,我们不要求被检验的 2 组数据包含相同个数的元素,换句话说,秩和检验更适用于非成对数据之间的差异性检测。
数据 x1 | 总排名 rank | 数据 x2 | 总排名 rank |
---|---|---|---|
9 | 14 | 7 | 11 |
5 | 5.5 | 4 | 3 |
8 | 13 | 5 | 5.5 |
7 | 11 | 6 | 8 |
10 | 15 | 3 | 1 |
6 | 8 | 6 | 8 |
7 | 11 | 4 | 3 |
4 | 3 |
2. Wilcoxon 符号秩检验
根据 wikipedia 解释, Wilcoxon signed-rank test 定义如下,
A Wilcoxon signed-rank test is a nonparametric test that can be used to determine whether two dependent samples were selected from populations having the same distribution. 3
基本概念: Wilcoxon signed-rank test(威尔科克森符号秩检验)也是一种非参的假设检验方法,它成对的检查 2 个数据集中的数据(即 paired difference test)来判断 2 个数据集是否来自相同分布的总体。
应用实例: 假设我们有 2 组数据 y1 和 y2,如下表所示。我们按照如下3步来计算 wilcoxon signed-rank test 的结果。
ID | 数据 y1 | 数据 y2 | 符号位 sign | 绝对差值 abs | 绝对差值的排名 rank |
---|---|---|---|---|---|
0 | 125 | 110 | +1 | 15 | 7 |
1 | 115 | 122 | -1 | 7 | 3 |
2 | 130 | 125 | +1 | 5 | 1.5 |
3 | 140 | 120 | +1 | 20 | 9 |
4 | 140 | 140 | - | 0 | - |
5 | 115 | 124 | -1 | 9 | 4 |
6 | 140 | 123 | +1 | 17 | 8 |
7 | 125 | 137 | -1 | 12 | 6 |
8 | 140 | 135 | +1 | 5 | 1.5 |
9 | 135 | 145 | -1 | 10 | 5 |
-
Wilcoxon, Frank. “Individual Comparisons by Ranking Methods.” Biometrics Bulletin 1.6(1945):80-83. link ↩︎
-
常见各种分布临界值表 https://lrita.github.io/images/posts/math/applex3.pdf
Wilcoxon 秩和检验 表格
http://socr.ucla.edu/Applets.dir/WilcoxonRankSumTable.html
http://plantsys.elte.hu/oktatas/Biometria/tablazatok/Wilcoxon_table_ketmintas_probahoz.pdf