偏度和峰度

偏度和峰度

偏度(skewness)

  • 数据分布的的不对称性称为偏态。偏态是指数据分布的偏斜方向和程度。偏度,通常分为右偏(正偏)和左偏(负偏)两种。它们是以对称分布为标准相比较而言的。
  • 在对称分布的情况下,平均数、中位数和众数是合而为一的。
  • 在偏态分布的情况下,平均数、中位数与众数是分离的。如果众数在左边,平均数在右边,即数据的极端值在右边,数据分布曲线向右延伸,则称为右向偏态。右向偏态,众数的数值较小,平均数的数值较大,平均数与众数之差为正值,因此右向偏态又称为正向偏态。
  • 如果众数在右边,平均数在左边,即数据的极端值在左边,数据分布曲线向左延伸,则称为左向偏态。

【偏度(Skewness)就是分布不对称的程度。正态分布是完全对称的,所以正态分布的偏度为零。但是现实中很多分布是不对称的,有的偏向左边,有的偏向右边,所以就用偏度来衡量分布偏离的程度。

偏度是离群值(Outliers)导致的。离群值是那些正数中特别大或者负数中特别小的值,也就是绝对值特别大的值。从名字也可以看出来,这些数值特别不合群,不是特别大,就是特别小,有点离群索居的感觉,所以叫做离群值。】

参考

在这里插入图片描述

在这里插入图片描述

峰度(kurtosis)

峰度(Kurtosis)是衡量某个分布相比正态分布而言,其峰值高低的程度。其中,尖峰态(Leptokurtic)就是比正态分布更尖的一种分布,低峰态(Platykurtic)是指没有正态分布那么尖的一种分布,常峰态(Mesokurtic)就是峰值和正态分布相同的分布。

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

df_train['test'].skew()    # 偏度
df_train['test'].kurt()     # 峰度
  • 5
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值