偏度
偏度(Skewness)可以用来度量随机变量概率分布的不对称性。
公式:
其中
是均值,
是标准差。
计算例子:
一组数据为1、2、2、4、1,均值为2,标准差约为1.22,所以偏度为
几何意义:
偏度的取值范围为(-∞,+∞)
当偏度<0时,概率分布图左偏。
当偏度=0时,表示数据相对均匀的分布在平均值两侧,不一定是绝对的对称分布。
当偏度>0时,概率分布图右偏。
例如上图中,两个概率分布图都是均值=0.6923,标准差=0.1685的,但是他们的形状是不一样的,左图偏度=-0.537,形状左偏,右图偏度=0.537,形状右偏。
峰度
峰度(Kurtosis)可以用来度量随机变量概率分布的陡峭程度。
公式:
其中
是均值,
是标准差。
几何意义:
峰度的取值范围为[1,+∞),完全服从正态分布的数据的峰度值为 3,峰度值越大,概率分布图越高尖,峰度值越小,越矮胖。
例如上图中,左图是标准正太分布,峰度=3,右图的峰度=4,可以看到右图比左图更高尖。
通常我们将峰度值减去3,也被称为超值峰度(Excess Kurtosis),这样正态分布的峰度值等于0,当峰度值>0,则表示该数据分布与正态分布相比较为高尖,当峰度值<0,则表示该数据分布与正态分布相比较为矮胖。
参考文献:
[1] Measures of Shape: Skewness and Kurtosis