案例如下(来源于《卫生统计学(第八版)》):
为研究大骨节病是否与粮食中DON 含量有关,采集大骨节病高发地区面粉20份,测量面粉中DON含量,结果( g/g)如下:
0, 0, 0, 0, 0, 12.4, 34.1, 69.0, 98.4, 129.5,156.1, 163.5, 170.9, 177.6, 172.4, 180.3, 189.2, 192.2, 196.8, 205.3,
该组数据的中位数为142.8 g/g。
根据前期研究发现,非大骨节病区面粉中DON 含量平均水平(中位数)为18.9 g/g。
由此我们是否可以认为大骨节病区与非大骨节病区面粉中DON 含量不同?
单从样本数据来看,病区的面粉DON含量中位数为142.8,非病区该物质含量不到20,应该是差异很大。
但我们看看原始数据(如上),前5个测量值,均为“0”,后面大部分都超过100。所以,数据很不均匀,应该是不符合正态分布,并且样本量也只有20,因此,本例采用非参数检验是可行的。
1.数据准备
在SPSS中建立两个变量:“DON 含量 1” 表示大骨节病区面粉中 DON 含量, “DON 含量 2” 表示非大骨节病区面粉中 DON 含量,SPSS 数据文件格式见图1。
图1
仔细看,会发现,上表中第2个变量的值都是“18.9”,这是因为,本例我们进行的检验严格而言属于“单样本秩和检验”。
SPSS采用配对的方式进行实施,再次说明了配对样本检验实际上是单样本检验的特例,这一点,我们学习t检验时就提及过。