简介
- 不需要对总体分布作任何事先的假设(如正态分布)
- 从检验内容上说,也不是检验总体分布的某些参数,而是检验总体某些有关的性质,所以称为非参数检验
- 前面进行的假设检验和方差分析,大都是在数据服从正态 分布或近似地服从正态分布的条件下进行的。但是如果总体的 分布未知,或对总体分布知之甚少的情况下,如何利用样本信息 对总体分布形态做出推断? 非参数检验 -指推断过程不涉及总体 分布中的参数
场景
- 未知分布型,或样本数太少(n<=6)而使得分布状况尚未显示出来
- 非参数性,只能以严重程度、优劣等级、效果大小、名次先后以及综合判断等方式记录其符号或等级
- 分布程度偏态
- 组内个别随机变量偏离过大。
缺点
当测量的数据能够满足参数统计的所有假设时,非参数检验方法虽然也可以使用,但效果远不如参数检验方法。由于当数据满足假设条件时,参数统计检验方法能够从其中广泛地充分地提取有关信息。非参数统计检验方法对数据的限制较为宽松,只能从中提取一般的信息,相对参数统计检验方法会浪费一些信息。
卡方检验简介
- 简介
目的: 根据样本数据推断总体的分布与某个已知分布是否有显著差异 —吻合性检 - 场景
适用于具有明显分类特征的数据
基本假设
H0: 总体分布与理论分布无显著差异
基本方法
数据集
随机抽取100名公司新招聘员工的性别情况,使用卡方检验方法研究该公司新招聘员工男女比例是否存在显著差异
菜单
参数设置
变量
期望全距:用于确定卡方检验的数据范围
- 从数据中获取
将使用数据中的最大值和最小值作为检验范围 - 使用指定的范围
可以在上限和下限输入框中输入设定的范围
- 从数据中获取
期望值: 设置总体中各分类所占的比例
- 所有类别相等
检验总体服从均匀分布 - 值
可以在其后的输入框中输入指定组的期望概率值
注意:值输入的顺序要与检验统计量递增的顺序相同
- 所有类别相等
精确
- 仅渐进法
表示显著性水平的计算基于渐近分布假设。渐进方法要求足够大的样本容量,如果样本容量偏小,该方法将会失效 - Monte Carlo
使用Monte Carlo模拟方法计算显著性水平。一般应用于不满足渐近分布假设的巨量数据。需要输入相应的置信水平和样本数 - 精确
可以得到精确的显著性水平,缺点是计算量过大。用户可以设置相应的计算时间,如果超出该时间,SPSS将会自动停止计算并输出结果
选项
分析结果
描述性统计量
频率
检验统计量
渐进显著性水平为0.655,远大于0.05,所以该公司新招聘员工的男女比例没有显著差异