最近在学习过程中,遇到偏度和峰度总令人难以理解其含义,特别是峰度。现记录下国内大学两本权威教材中的解释以及网上搜集资料的一些结论。结论在最后!!!
一、偏度
《概率论与数理统计教程(第三版)》茆诗松(以下简称“茆书”)中关于偏度的解释:
总体:
样本:
《统计学(第七版)》贾俊平(以下简称“贾书”)中关于偏度的解释:
总体:
关于偏度,感觉茆书的解释比较好理解。
二、峰度
茆书关于峰度的解释:
总体:
样本:
贾书:
总体:
可见两本书对于峰度的计算都减了3.
抛开上面的计算方式不谈。
一般来说,峰度越大,峰部越陡峭(不一定越高)尾部越厚。但需要注意的是:
1.尖峰肥尾是和正态分布做比较的。
2.尖峰肥尾是有假设条件的:离散程度和正态分布一样,也就是方差和正态分布一样。
那么为了弥补峰部较低的离散程度(较高的集中程度),尾部的数值需要多一些,来拉高整体的离散程度,以使其与正态分布相等。
通过网上查找资料,有以下更为准确的结论:
1.kurtosis(峰度)越大,分布的尾部越厚。
2.kurtosis包含很少关于密度分布函数中心区的信息,它与分布函数中心区的峰态无关。
3.Kurtosis应该理解为尾态,而非它的中文翻译:峰度。
4.leptokurtic(译:高狭峰)只是厚尾,而非尖峰厚尾。
5.在跟正态分布比较峰度时,应使比较双方的方差相等,这样比较才有意义
具体可参考:https://riscap.wordpress.com/2020/04/26/%e4%b8%ba%e4%bb%80%e4%b9%88kurtosis%e4%b8%8d%e6%98%af%e5%b3%b0%e5%ba%a6%ef%bc%9f/