偏度和峰度的计算

 

目录

正文

偏度(skewness)和峰度(kurtosis):

  偏度能够反应分布的对称情况,右偏(也叫正偏),在图像上表现为数据右边脱了一个长长的尾巴,这时大多数值分布在左侧,有一小部分值分布在右侧。

  峰度反应的是图像的尖锐程度:峰度越大,表现在图像上面是中心点越尖锐。在相同方差的情况下,中间一大部分的值方差都很小,为了达到和正太分布方差相同的目的,必须有一些值离中心点越远,所以这就是所说的“厚尾”,反应的是异常点增多这一现象。

偏度的定义:

image

样本X的偏度为样本的三阶标准矩

其中μ μ 是均值,δ δ 为标准差,E是均值操作。μ 3  μ3 是三阶中心距,κ t  κt 是t th  tth 累积量

 

偏度可以由三阶原点矩来进行表示:

image

 

样本偏度的计算方法:

一个容量为n的数据,一个典型的偏度计算方法如下:

image

其中x ¯  x¯ 为样本的均值(和μ μ 的区别是,μ μ 是整体的均值,x ¯  x¯ 为样本的均值)。s是样本的标准差,m 3  m3 是样本的3阶中心距。

另外一种定义如下:

image

k 3  k3 是三阶累积量κ 3  κ3 的唯一对称无偏估计(unique symmetric unbiased estimator)(k 3  k3 和 κ 3  κ3 写法不一样)。k 2 =s 2  k2=s2 是二阶累积量的对称无偏估计。

大多数软件当中使用G 1  G1 来计算skew,如Excel,Minitab,SAS和SPSS。

峰度的定义:

image

  峰度定义为四阶标准矩,可以看出来和上面偏度的定义非常的像,只不过前者是三阶的。

样本的峰度计算方法:

image

 

样本的峰度还可以这样计算:

 

image

其中k 4  k4 是四阶累积量的唯一对称无偏估计,k 2  k2 是二阶累积量的无偏估计(等同于样本方差),m 4  m4 是样本四阶平均距,m 2  m2 是样本二阶平均距。

同样,大多数程序都是采用G 2  G2 来计算峰度。

python使用pandas来计算偏度和峰度

import pandas as pd
x = [53, 61, 49, 66, 78, 47]
s = pd.Series(x)
print(s.skew())
print(s.kurt())

它是用上面的G 1  G1 来计算偏度  G 2  G2 来计算峰度,结果如下:

0.7826325504212567
-0.2631655441038463
  • 7
    点赞
  • 36
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值