学习模式上的记录之统计篇一秩和检验

Siemer

已于 2022-03-10 16:13:00 修改

阅读量3.2k

点赞数 2

分类专栏：小拖机的统计分析文章标签：统计学

于 2021-01-20 20:16:25 首次发布

本文链接：https://blog.csdn.net/Siemer/article/details/112909538

版权

小拖机的统计分析专栏收录该内容

9 篇文章 1 订阅

订阅专栏

学了快三年模式了，为了说服自己模式的结果是可信的，以及对数据做更好的处理，中间补习了很多统计方面的知识，现在想想不如都放在这里，中间有很多借鉴和参考他人的博客和理解，都记录下来了，方便自己查阅，也希望可以帮助其他人。

Wilcoxon 秩和检验（rank-sum-test），或叫 Mann-Whitney U 检验，Mann-Whitney U 检验:也叫 Mann–Whitney–Wilcoxon (MWW) , Wilcoxon rank-sum test, or Wilcoxon–Mann–Whitney test，是一种非参数秩和假设检验，对独立样本进行的一种不要求正态分布的 t-test 检验方法。主要是对来自除了总体均值以外完全相同的两个总体，检验其是否具有显著差异，样本大小大于20时，检验的效果最好。是一类非参数检验方法。但是当数据实际上满足正态分布的时候，用t检验更有效。

秩和检验的原理和做法：

- 原理：

两个独立样本的t-test是检验两个样本的均值是否相等。而相对的，两个独立样本的 Wilcoxon test 则是检验两个样本的中位数，或者说两个样本的分布是否有偏移。因此，Wilcoxon test 在计算统计量时是先将两个样本混到一起，然后对混合后的list进行从小到大排序，根据排序把两个样本的值分别转换成排序序数，最后比较两个样本的序数的大小。如果序数大的富集在其中一个样本，表明该样本相对另一个样本的值要更大，相反亦然。

- 做法：

首先将两类样本混在一起，对所有样本按照所考察的特征从小到大排序。在两类样本中分别计算所得排序序号之和 T₁ 和 T₂ ，称作秩和。两类样本的个数分别是 n₁ 和 n₂ 。

首先，将 n₁ + n₂ 个实验数据混合在一起，并按照从小到大的次序排列，每个试验值在序列中的次序叫做该值的秩（rank），然后将属于第一组数据的秩相加，其和记为 R₁ ，成为第一组数据的秩和（rank sum），同理，可求第二组数据的秩和 R₂ ，如果两组数据之间没有显著性差异，则 R₁ 就不应该太大或太小，对于给定的显著性水平 α 和 n₁, n₂ ，由秩和临界值表可以查得 R₁ 的上下限值 T₂ 和 T₁ ，如果 R₁>T₂ 或者 R₁<T₁ ，则认为两组数据有显著差异，否则，则两组数据无显著差异。

在进行秩和检验时如果几个数据相等，则他们的秩应该是相等的，等于相应几个秩的算术平均值。
为了比较两类样本的秩和是否差异显著，需要比较T分布，当样本数目较大时，人们可以利用正态分布来近似秩和 T₁ 的分布。
秩和检验的基本思想是，如果一类样本的秩和显著地比另一类小（或大），则两类样本在所考察地特征上有显著差异。秩和检验地统计量就是某一类的秩和，某一类秩和哦，不是单纯的秩和。

假设：假设两个独立样本之间没有差异，成立则 H₀，不成立则 H₁。
检验步骤：

检验的两组独立样本，首先进行混合，并根据数据大小升序排列并编排等级（秩rank），遇到相同的数据时，等级值相等，为编排等级前的平均值
分别求出两个样本的等级和：R₁，R₂ ;
Mann-Whitney U 检验统计量 U₁,U₂ 的计算公式如下：

其中 n₁，n₂ 样本的大小，R₁，R₂ 分别为样本等级和。
其中 U₁，U₂ 中的最小值用于与显著检验 U_α （查 Mann-Whitney Table 可得具体值）相比较，如果 U_min <U_α 时，拒绝 H₀，接受 H₁.表明两样本之间存在差异。

Siemer

关注

2
点赞
踩
11

收藏

觉得还不错? 一键收藏
2
评论
学习模式上的记录之统计篇一秩和检验

学习模式上的记录之统计篇一秩和检验学了快三年模式了，为了说服自己模式的结果是可信的，以及对数据做更好的处理，中间补习了很多统计方面的知识，现在想想不如都放在这里，中间有很多借鉴和参考他人的博客和理解，都记录下来了，方便自己查阅，也希望可以帮助其他人。Wilcoxon 秩和检验（rank-sum-test），或叫 Mann-Whitney U 检验，是一类非参数检验方法。不对数据分布做特殊假设，因而能适用于更复杂的数据分布情况，但是当数据实际上满足正态分布的时候，用t检验更有效。秩和检验的原理和做法：
复制链接

扫一扫