统计学与工具实现(三)

偏度(skewness):数据分布对称性的衡量



偏度的公式不是唯一的,有多种定义形式,上述公式只是其中一种。

正偏度分布:右侧尾比左侧尾长,即大数值一端发生的次数较少(均值>中位数);

负偏度分布:左侧尾比右侧尾长,即大数值一端发生的次数较多(均值<中位数);

正态分布的偏度为0。



峰度(kurtosis):


      
    excess_k = kurtosis - 3

正态分布的峰度为3,excess_k为0,

低阔峰(platykurtic):相对于正态分布来说更扁平(excess_k < 0)

高峡峰(leptokurtic):相对于正态分布来说更陡峭(excess_k > 0)



工具实现

Excel


Excel里偏度有不同的公式:


Excel里峰度公式:



R

下面是调用了moments包,偏度计算的值和Excel中SKEW.P的计算结果相同,即采用公式

moments中峰度计算采用公式,所得结果和Excel中KURT计算结果不同。


R中除了moments包,还有fBasics包也提供了偏度和峰度计算,但公式和上面不一样,所以计算结果也不相同。



在R里面计算偏度和峰度的话,个人推荐使用moments包,因为使用的公式被普通使用。当然也可以根据公式自己计算。

Python

使用scipy中的stats计算偏度和风度,和R中moments包显示的结果一样。


Python里也有其他包计算偏度和峰度,这里的值和R中fBasics包显示的结果一样。


如果使用Python计算偏度和峰度,个人推荐使用scipy中的stats,原因同R中推荐使用moments包一样。
















评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值