有序/无序分类变量的统计推断
1 有序分类变量的统计推断——非参数检验
1.1 非参数检验概述
如果想要检验两个正态总体是否具有相同的均数 ,做t检验即可,这是一个典型的参数统计方法。参数统计方法往往假设统计总体的分布形态已知,但是在更多的实际场合常常由于缺乏足够信息 ,无法合理地去假设一个总体具有某种分布形式,此时就不能去使用相应的参数方法了。推而广之,不能使用参数方法的情形可能是当不知道所研究样本来着总体的具体分布,或已知总体分布与检验所要求的条件不符;数据的测量尺度是名义和顺序尺度,甚至某些变量可能无法稍确测量 ,均值、方差的计算已经没有意义时,但是,此时有的人却忽略参数统计方法的前提,仍然牵强地使用参数方法,面对由此得到的不合理结果却不知问题何在。 实际上,正确的思路应当是放弃对总体分布参数的依赖,转而寻求更多的纯粹来自数据的信息,这就是所谓的非参数统计方法。
非参数统计方法主要用于那些总体分布不能用有限个实参数来刻画,或者不考虑被研究的对象为何种分布以及分布是否已知的情形,它对总体分布几乎没有什么假定,只是有时对分布的形状做一些诸如连续、对称等简单假设。但实际上,并非说在推断中什么分布参数都不利于,而是指推断过程和结论均与原总体参数无关。例如,最常用的秩和检验就是基于秩次的分布特征推导出来的。
和参数方法相比,非参数检验方法的优势如下:
- 稳健性。因为对总体分布的约束条件大大放宽,不至于因为统计中的假设过程过分理想化而无法切合实际情况,不至于对个别偏离较大的数据太敏感
- 对数据的测量尺度无约束时,对数据的要求也不严格,什么数据类型都可以做
- 适用于小样本、无分布样本、数据污染样本、混杂样本等
非参数检验预备知识