学习模式上的记录之统计篇一 秩和检验

学了快三年模式了,为了说服自己模式的结果是可信的,以及对数据做更好的处理,中间补习了很多统计方面的知识,现在想想不如都放在这里,中间有很多借鉴和参考他人的博客和理解,都记录下来了,方便自己查阅,也希望可以帮助其他人。

Wilcoxon 秩和检验(rank-sum-test),或叫 Mann-Whitney U 检验,Mann-Whitney U 检验:也叫 Mann–Whitney–Wilcoxon (MWW) , Wilcoxon rank-sum test, or Wilcoxon–Mann–Whitney test,是一种非参数秩和假设检验,对独立样本进行的一种不要求正态分布的 t-test 检验方法。主要是对来自除了总体均值以外完全相同的两个总体,检验其是否具有显著差异,样本大小大于20时,检验的效果最好。是一类非参数检验方法。但是当数据实际上满足正态分布的时候,用t检验更有效

秩和检验的原理和做法:

- 原理:

两个独立样本的t-test是检验两个样本的均值是否相等。而相对的,两个独立样本的 Wilcoxon test 则是检验两个样本的中位数,或者说两个样本的分布是否有偏移。因此,Wilcoxon test 在计算统计量时是先将两个样本混到一起,然后对混合后的list进行从小到大排序,根据排序把两个样本的值分别转换成排序序数,最后比较两个样本的序数的大小。如果序数大的富集在其中一个样本,表明该样本相对另一个样本的值要更大,相反亦然。

- 做法:

首先将两类样本混在一起,对所有样本按照所考察的特征从小到大排序。在两类样本中分别计算所得排序序号之和 T1T2 ,称作秩和。两类样本的个数分别是 n1n2

首先,将 n1 + n2 个实验数据混合在一起,并按照从小到大的次序排列,每个试验值在序列中的次序叫做该值的秩(rank),然后将属于第一组数据的秩相加,其和记为 R1 ,成为第一组数据的秩和(rank sum),同理,可求第二组数据的秩和 R2 ,如果两组数据之间没有显著性差异,则 R1 就不应该太大或太小,对于给定的显著性水平 αn1, n2 ,由秩和临界值表可以查得 R1 的上下限值 T2T1 ,如果 R1>T2 或者 R1<T1 ,则认为两组数据有显著差异,否则,则两组数据无显著差异。

在进行秩和检验时如果几个数据相等,则他们的秩应该是相等的,等于相应几个秩的算术平均值。
为了比较两类样本的秩和是否差异显著,需要比较T分布,当样本数目较大时,人们可以利用正态分布来近似秩和 T1 的分布。
秩和检验的基本思想是,如果一类样本的秩和显著地比另一类小(或大),则两类样本在所考察地特征上有显著差异。秩和检验地统计量就是某一类的秩和,某一类秩和哦,不是单纯的秩和。

假设:假设两个独立样本之间没有差异,成立则 H0,不成立则 H1
检验步骤:

  1. 检验的两组独立样本,首先进行混合,并根据数据大小升序排列并编排等级(秩rank),遇到相同的数据时,等级值相等,为编排等级前的平均值
  2. 分别求出两个样本的等级和:R1,R2 ;
  3. Mann-Whitney U 检验统计量 U1,U2 的计算公式如下:
    tongjisu

其中 n1,n2 样本的大小,R1,R2 分别为样本等级和。
其中 U1,U2 中的最小值用于与显著检验 Uα (查 Mann-Whitney Table 可得具体值)相比较,如果 Umin <Uα 时,拒绝 H0,接受 H1.表明两样本之间存在差异。

推荐阅读
秩和检验
Wilcoxon 检验之 rank-sum 与 signed-rank

  • 2
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值