偏度与峰度的正态性分布判断

本文介绍了偏度与峰度的概念,用于检测数据是否符合正态分布。偏度衡量分布的不对称性,峰度则反映分布的陡峭或平滑程度。通过计算Z-score,可以评估偏度和峰度是否符合正态分布。在样本量小于100时,这种方法较为合适。SPSS分析结果显示,某个特征的峰度Z-score超过阈值,表明该特征不符合正态分布。
摘要由CSDN通过智能技术生成

 当我们应用统计方法对数据进行分析时,会发现许多分析方法如T检验、方差分析、相关分析以及线性回归等等,都要求数据服从正态分布或近似正态分布,正态分布在机器学习的重要性后期会讲述。上一篇文章用Q-Q图来验证数据集是否符合正态分布,本文首先介绍了偏度与峰度的定义,然后用偏度与峰度检测数据集是否符合正态分布,最后分析该检测算法的适用条件以及SPSS的结果分析。

1、 偏度与峰度


 

(1) 偏度(Skewness)

        偏度衡量随机变量概率分布的不对称性,是相对于平均值不对称程度的度量,通过对偏度系数的测量,我们能够判定数据分布的不对称程度以及方向。

具体来说,对于随机变量X,我们定义偏度为其的三阶标准中心距:

对于样本的偏度,我们一般记为SK,我们可以基于矩估计,得到有:

 

 

        偏度的衡量是相对于正态分布来说,正态分布的偏度为0ÿ

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值