数据要求:单峰对称分布,数据在其两边分布的疏密情况是对称的
很过不对称的单峰数据分布可能通过变换化为对称分布。多峰分布通过混合分布整体表示后,每一个分布也可以用单峰对称的分布表示。就对称分布而言,对称中心只有一个,中位数却可能有很多个。
例子:
-0.27 -0.03 -0.56 -0.14 -0.15 30 80 100
对数据来说,0是这组数据的中位数,有相等数量的正号和负号;如果只看秩,而不看数据的取值,直觉上是一个以0为中心样本。但实际上,取负值的数据相对比较密,取正值的数据相对比较稀疏,这不满足对称要求对称中心两边的分布相同的特点。为什么符号的做法失败了?问题出在没有考虑数据绝对值的大小上,
Wilcoxon符号秩统计量的思想是:首先把样本的绝对值|X1|、|X2|、|X3|……|Xn|排序,其顺序统计量为|X|(1)、|X|(2)、|X|(3)……|X|