偏度和峰度的计算

最新推荐文章于 2024-07-23 15:36:25 发布

It_BeeCoder

最新推荐文章于 2024-07-23 15:36:25 发布

阅读量1.9w

点赞数 7

分类专栏： 41 学术科研

41 学术科研专栏收录该内容

85 篇文章 14 订阅

订阅专栏

目录

偏度(skewness)和峰度(kurtosis)：
偏度的定义：
样本偏度的计算方法：
峰度的定义：
样本的峰度计算方法：
python使用pandas来计算偏度和峰度

正文

偏度(skewness)和峰度(kurtosis)：

偏度能够反应分布的对称情况，右偏（也叫正偏），在图像上表现为数据右边脱了一个长长的尾巴，这时大多数值分布在左侧，有一小部分值分布在右侧。

峰度反应的是图像的尖锐程度：峰度越大，表现在图像上面是中心点越尖锐。在相同方差的情况下，中间一大部分的值方差都很小，为了达到和正太分布方差相同的目的，必须有一些值离中心点越远，所以这就是所说的“厚尾”，反应的是异常点增多这一现象。

偏度的定义：

样本X的偏度为样本的三阶标准矩

其中μ μ 是均值，δ δ 为标准差，E是均值操作。μ 3 μ3 是三阶中心距，κ t κt 是t th tth 累积量

偏度可以由三阶原点矩来进行表示：

样本偏度的计算方法：

一个容量为n的数据，一个典型的偏度计算方法如下：

其中x ¯ x¯ 为样本的均值（和μ μ 的区别是，μ μ 是整体的均值，x ¯ x¯ 为样本的均值）。s是样本的标准差，m 3 m3 是样本的3阶中心距。

另外一种定义如下：

k 3 k3 是三阶累积量κ 3 κ3 的唯一对称无偏估计(unique symmetric unbiased estimator)（k 3 k3 和 κ 3 κ3 写法不一样）。k 2 =s 2 k2=s2 是二阶累积量的对称无偏估计。

大多数软件当中使用G 1 G1 来计算skew，如Excel，Minitab，SAS和SPSS。

峰度的定义：

峰度定义为四阶标准矩，可以看出来和上面偏度的定义非常的像，只不过前者是三阶的。

样本的峰度计算方法：

样本的峰度还可以这样计算：

其中k 4 k4 是四阶累积量的唯一对称无偏估计，k 2 k2 是二阶累积量的无偏估计（等同于样本方差），m 4 m4 是样本四阶平均距，m 2 m2 是样本二阶平均距。

同样，大多数程序都是采用G 2 G2 来计算峰度。

python使用pandas来计算偏度和峰度

import pandas as pd
x = [53, 61, 49, 66, 78, 47]
s = pd.Series(x)
print(s.skew())
print(s.kurt())

它是用上面的G 1 G1 来计算偏度 G 2 G2 来计算峰度，结果如下：

0.7826325504212567
-0.2631655441038463

关注

7
点赞
踩
36

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。