数据不满足正态分布,方差齐性怎么办?

数据不满足正态分布,方差齐性怎么办?

实验数据的分布情况(服从正态分布)和变异情况(方差齐性)是以统计假设参数的前提条件的方式提出来的。大都认为数据不服从正态分布,或不满足方差齐性,就不能进行有关的检验(方差分析、Z检验、t检验)。

什么是服从正态分布?

所谓的样本均数是服从正态分布是指每组数据来自正态分布的总体,而所有的样本数据也绝对不可能满足正态分布,但只要通过正态分布拟合检验就可以了。

什么是方差齐性?

所谓方差齐性,即所比较的各族样本来自总体的方差相等,是通过样本方差比较来判断的。显然各组样本的方差不会绝对相等,但只要彼此相差不过于悬殊,就可以认为“方差齐性”基本满足,严格地说这就是“方差齐性检验”。实际上只要何种样本方差之间的差别在统计学上无显著性差异,就认为已满足方差齐性的条件,就可以进行统计学的参数检验了,否则就认为比较的各族样本来自总体“方差不齐”。
为什么要满足正态分布和方差齐性?

然而,对于为什么统计假设的参数检验必须要满足正态分布和方差齐性条件?不满足正态分布或不满足方差齐性将意味着什么?大都未能给予充分的解释。由于这些条件根本上是来自中心极限定理所要求的,许多对统计学原理不了解的学习者和研究者,在进行统计假设的参数检验时,也缺少对“正态分布”和“方差齐性”条件的正确认识。有的人认为方差齐性不满不能直接进行统计假设检验。有的人需要对统计量进行转换,选择另外一个变换后的统计量进行参数检验。

数据正态化转换方法有哪些?

了解决数据的正态性问题,数学家们总结了很多转化方法,但是没有百事通,都需要对症下药,根据数据的实际分布情况,选择合适的转化方法。

计算数据的峰度和偏度,根据数据的分布性状和参数,是否决定做正态性转换。

(1)偏度检验
偏度:完全对称偏度=0(正态分布),值<0,则为负偏态;值>0,为正偏态,可通过画图判断。
在这里插入图片描述
(2)峰度检验

是判断曲线陡峭或平缓的指标,如果峰度=0,说明该变量分布合适(常峰态,但罕见);如果峰度>0,说明该变量的分布陡峭(尖峰态);反之,如果峰度<0,说明变量的分布平缓(低峰态)。峰度也需要通过显著检验来判断与正态分布是否有显著差别。我们可能可以通过转换来达到或接近正态分布。

3)根据变量分布形状,确定相应的转换方法

(正偏态的数据可考虑直接使用以下方法,如果呈负偏态的数据,需要先做反向转换后再进行以下转换操作。)

1、中度偏态:偏度标准误差()的2~3倍,可考虑取根号来转换,n为样本量,SPSS指令:sqrt
在这里插入图片描述
2、高度偏态:偏度标准误差()大于3倍以上,可考虑取对数,自然对数和以10为底的对数(力度较强),看情况而定,SPSS指令:Ln,Lg10
在这里插入图片描述
在这里插入图片描述
3、对于服从二项分布的率或百分比资料,可考虑使用平方根正弦变换,SPSS指令:Sqrt;
在这里插入图片描述
4、常用的还有Box-Cox转换,bootstraps法等,Box-Cox转换常见与是解决连续性变量(线性回归)不满足正态分布的情况。

SPSS上没有,在R语言中,可以使用car包中的power Transform()函数进行转换;

疑问集锦:

(1)不是所有的数据都需要正态性转换,一般适用于小样本的数据,较大样本我们可以认为近似正态分布;

(2)非正态的数据经过转换后一定为服从正态分布吗?不一定所有的数据经过转换后都能通过正态性检验,非正态性的数据也可以采用非参数检验进行比较;

(3)在进行统计描述的时候,是描述转换后的变量情况,还是转换前的?转换前的为宜,可与其他人的研究进行横向比较。

(4)如果转换一次后仍然不满足正态分布怎么办?在结果的基础上再次检验其分布形态,从头做起,直到达到目的。

(5)什么是反向转换?简单来说就是,最大的变成最小的,最小的变成最大的。

https://zhuanlan.zhihu.com/p/125583862

  • 6
    点赞
  • 82
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值