非参数检验适用于不了解样本所来自的总体的分布律时的情形--由于不了解分布律,便不可能选用任何参数(例如方差或是均值)。
本文总结了alevel further statistics chapter 11中全部三大类型的无参检验(对应样本大时转换为正态分布的三个公式),其中sign test(符号检验)与signed-rank test(有符号秩检验)分为single-samples(单项样本)与 paired- samples(两关联样本)两种情况,故一共有五种具体的检验方式。
本文适合复习使用...
零假设与备择假设选定规则:
一般规则:
显著性水平与临界值:
单边检验(备择假设中使用>或<,增长,恶化等词)则直接使用题干中显著性水平的数据,例如显著性水平significance level=5%=0.05.
双边检验(备择假设中使用≠,无差别,无效果等词)则使用题干中的显著性水平除以2得到的数值,例如显著性水平为5%,0.05/2=0.025.
取决于检验类型是单边检验还是双边检验,各类sign test(符号检验)中,critical value(临界值)=significance level(显著性水平)或是等于显著性水平除以2;而各类有符号秩检验和秩和检验中,为读取临界值则应当查阅秩和表。
显著性水平越大则越难通过检验,例如significance level 10%的拒绝率要大于5%的拒绝率。
警告:若解题过程中发现由于样本量过大而无法在秩和表中读取到相应的临界值则应当考虑使用正态分布重新计算test statistic(检验统计量)后查阅正态分布表以读取临界值(具体方法见下文)
结论:
test statistic检验统计量>critical value临界值则'do not reject',即通过原假设。
test statistic检验统计量≤critical value临界值则'reject',即拒绝原假设。
注意这一点是针对各类非参数检验而言的,对于诸如t检验与卡方检验则正好相反。
- 有符号秩检验相比符号检验的优点在于其不仅仅考虑了符号还考虑了magnitude(大小)这一因素。但若要使用,则需满足更严格的条件‘样本来自symmetrical(对称分布)的总体‘。
- 非参数检验与t检验在针对对照试验的应用上的差别:1.非参数检验不要求已知总体的分布律,而t检验需要样本来自正态总体。2.无参数检验针对中位数,而t检验则针对均值。
Single-samples sign test 单项样本符号检验:
是binomial test(二项检验)的一种,要求样本组满足:
1.属于连续性数据-continuous
2.每个数据之间互相独立-independent
其检验某单组数据的中位数是否=/≠/>/<一个给定常数c。
处理步骤:
1.提出假设。
2.把大于c的数据标记上'+',把小于c的数据标记上'-'
Exception:若某数据=c则去除这个数据。
3.将'+'的总个数记作
4.使用二项分布,若
5.临界值=显著性水平(单边检验)或临界值=
6.结论.
当样本量大(n>10)则应当对检验统计量的分布使用正态模型,
注:为方便起见,此处及以下全部假设题干中给出的显著性水平为5%。
Wilcoxon signed-rank test 有符号秩检验:
这要求样本组满足:
1.属于连续性数据-continuous
2.每个数据之间互相独立-independent
3.来自一个对称分布的总体-symmetrical
其检验某单组数据的中位数是否=/≠/>/<一个给定常数c。
处理步骤:
1.提出假设。
2.求出每一个数据与c的差,若为正数的则在数值前上'+',差为负数的在数值前标记上'-',这形成了一个新的数据组'difference'。
Exception:若某数据=c则去除这个数据。
3.对数组difference中每个数据的绝对值的大小进行排序,并标上由小到大的顺序(1,2,3..n)
Exception:若排序中第r个数据与第r+1个数据相等,则两个数据都标作
4.对数组difference中所有正数所对应的的排序求和,得出P;对所有负数所对应的排序求和,得出N。
5.检验统计量:T=min(N,P)
5.临界值参考秩和表.
6.结论.
当样本量大(n>10)则应当对检验统计量的分布使用正态模型,
Paired-samples sign test 两关联样本符号检验
这与单项样本的符号检验是高度类似的,只是这里比较的是每一对的两个数据之间的大小,这要求样本组满足:
1.属于连续性数据-continuous
2.每个数据之间互相独立-independent
3.两组样本中的数据可进行一一对应-paired
其检验两组数据的中位数是否相等,常见于对照试验。
处理步骤:
1.提出假设。
2.对于每一对对应的数据,当第一组中的数据小于第二组中的数据时,标记'-',反之标记'+'
Exception:若某一对数据相等则去除这对数据。
3.将'+'的总个数记作
4.使用二项分布,若
5.临界值=显著性水平(单边检验)或临界值=
6.结论.
Paired-samples Wilcoxon signed-rank test 两关联样本的有符号秩检验:
这是在单项样本的有符号秩检验的基础上进行了少量调整后的检验,其要求样本组满足:
1.属于连续性数据-continuous
2.每个数据之间互相独立-independent
3.来自一个对称分布的总体-symmetrical
4.两组样本中的数据可进行一一对应-paired
其检验某两组数据的中位数是否相等,常用于比对对照组与实验组。
处理步骤:
1.提出假设。
2.求出每一对对应数据之间的差,若为正数的则在数值前上'+',差为负数的在数值前标记上'-',这形成了一个新的数据组'difference'。
Exception:若某一对数据相等则去除这对数据。
3.对数组difference中每个数据的绝对值的大小进行排序,并标上由小到大的顺序(1,2,3..n)
Exception:若排序中第r个数据与第r+1个数据相等,则两个数据都标作
4.对数组difference中所有正数所对应的的排序求和,得出P;对所有负数所对应的排序求和,得出N。
5.检验统计量:T=min(N,P)
5.临界值参考秩和表.
6.结论.
Wilcoxon rank-sum test 秩和检验
其检验某两组数据的中位数是否相等,常用于比对对照组与实验组,与两关联样本的有符号秩检验的差别在于,秩和检验不要求两组样本中的数据可以一一对应(paired),故两组样本可以是不同容量的。使用这个检验应该满足三条条件:
1.属于连续性数据-continuous
2.每个数据之间互相独立-independent
3.两组数据均来自对称分布的总体-symmetrical
处理步骤:
1.提出假设。
2.将这两组数据写成一行,但应该能够对着两组数据的成员加以区分(个人习惯写成一行后在两组数据的交界处画一条竖线)
3.对写成一行的数据进行大小排序,并标上由小到大的顺序(1,2,3..n)
Exception:若排序中第r个数据与第r+1个数据相等,则两个数据都标作
4.分别对两组数据中每个成员所对应的排序进行求和。
5.m和n分别是两组数据的样本容量,其中我们规定m<n,并定义
5.临界值参考秩和表.
6.结论.
当样本量大(n>10)则应当对检验统计量的分布使用正态模型,