在非正态分布的数据中,我们不应该使用单样本t检验(尽管这个检验对于偏离正态性相当稳健),相反,我们必须使用均值的非参数检验方法。我们可以进行Wilcoxon符号秩和检验。注意和单样本t检验不同,该检验检查是否有差异:
(rank, pVal) = stats.wilcoxon(data-checkValue)
该方法有3个步骤:
- 计算每个观测值和感兴趣的值的差异;
- 忽略差异的符号,将他们按照大小排序;
- 将所有负(或正)秩次的秩次加起来,也就是那些低于(或高于)选定的假设值的秩次。
在下面的表格中,你可以看到一个判断是否显著偏离7725的检验,负值的秩次之和为3+5=8,并且可以在对应的表格中找到显著的,在实际中,你的python函数语句会帮你做这些。
这个例子也展示了秩次求值的另外一个特征:相同的值(在这里是7515)得到的是它们的平均秩次