统计学的Python实现-012:峰度

作者:长行

时间:2019.03.11

统计学解释

峰度:峰度是衡量一组数据分布曲线的陡峭程度。其定义式如下:
k u r t o s i s = E [ ( X − μ σ ) 4 ] = μ 4 σ 4 = E [ ( X − μ ) 4 ] ( E [ ( X − μ ) 2 ] ) 2 kurtosis=E[(\frac{X-\mu}{\sigma})^4]=\frac{\mu_4}{\sigma^4}=\frac{E[(X-\mu)^4]}{(E[(X-\mu)^2])^2} kurtosis=E[(σXμ)4]=σ4μ4=(E[(Xμ)2])2E[(Xμ)4]
其中 μ \mu μ为均值, σ \sigma σ为标准差, μ 4 \mu_4 μ4为四阶中心距。

但是通常而言,我们不会用定义式来计算峰度,而是使用其他的计算公式,例如如下的峰度计算公式(应用于SPSS):
k u r t o s i s = ( n + 1 ) n ( n − 1 ) ( n − 2 ) ( n − 3 ) ∑ i = 1 n ( x i − x ‾ ) 4 ( ∑ i = 1 n ( x i − x ‾ ) 2 ) 2 − 3 ( n − 1 ) 2 ( n − 2 ) ( n − 3 ) kurtosis=\frac{(n+1)n(n-1)}{(n-2)(n-3)}\frac{\sum^{n}_{i=1}{(x_i-\overline{x})^4}}{(\sum^{n}_{i=1}{(x_i-\overline{x})^2})^2}-3\frac{(n-1)^2}{(n-2)(n-3)} kurtosis=(n2)(n3)(n+1)n(n1)(i=1n(xix)2)2i=1n(xix)43(n2)(n3)(n1)2
其中 x i x_i xi样本均值。

若峰度大于0,则说明该组数据的分布曲线相较于正态分布更加陡峭;若峰度小于0,则说明该组数据的分布曲线相较于正态分布更加平缓。换言之,峰度越大,则数据在靠近均值的部分分布得越多,在距离均值较远的部分分布得较少。

下面我们通过几个例子来熟悉峰度的分布特征:

例1:当靠近均值部分的数据分布得越多时,峰度越高

数据 [1,1,1,1,1,1,2,3,4,5,5,5,5,5,5] 的峰度为 -2.098

数据 [1,1,1,2,2,2,3,3,3,4,4,4,5,5,5] 的峰度为 -1.328

数据 [1,2,3,3,3,3,3,3,3,3,3,3,3,4,5] 的峰度为 3.554

例2:当远离均值的数据分布得越分散时,峰度越高

数组 [1,4,5,6,9] 的峰度为 0.893

数组 [3,4,5,6,7] 的峰度为 -1.200

实现代码

import math
import numpy
data_test=[1,1,1,1,1,2,2,2,2,3,3,3,4,4,5]  # # 定义测试数据
def peakedness(data):
    n = len(data) #样本个数
    average=numpy.mean(data) #计算平均值
    k1=n*(n+1)*(n-1)/(n-2)/(n-3)
    k2=3*(n-1)**2/(n-2)/(n-3)
    m2=0;
    m4=0
    for i in data:
        m4+=(i-average)**4
        m2+=(i-average)**2
    peakedness=k1*m4/m2**2-k2
    return peakedness
print('peakedness =',peakedness(data_test))

结果

peakedness = -0.5076923076923086

实际应用

1.峰度可以用来衡量风险,同样的方差下,峰度越高,越容易取极端值。例如某一金融产品收益率的峰度很高,那么该金融产品的风险系数就会较大。

2.峰度可以帮助用来衡量众数的统计学意义。峰度越高,众数在描述该组数据的集中趋势的作用就越显著。

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

长行

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值