偏态与峰度

这是一篇学习笔记,若有不妥之处,欢迎评论指正

一、偏态

左右不对称即为偏态
口诀一:看长尾在哪边就是往哪偏
口诀二:峰左移,右偏态;峰右移,左偏态

数据状态描述图示
mean>median>mode正偏态、右偏态在这里插入图片描述
mean<median<mode负偏态、左偏态在这里插入图片描述
mode=median=mean对称分布在这里插入图片描述

我们为什么要去看数据的偏态?
1、更加全面的了解数据的分布,使用mode、median、mean三个指标来综合描述数据的分布。mode代表了样本中最多的样本的特性、median可以用于描述有一半的样本低于或高于某个值、mean用于描述样本的平均水平。对于明显左偏或者右偏的数据来说,使用中位数去描述数据状况比平均数更合理,因为平均数会受极值的影响。
2、左偏说明长尾在左边,左边有较多的极端数值。
3、许多算法要求样本服从正态分布,因此我们需要先观察数据的分布,如若不对称就要进行调整。

二、偏态系数SK

SK:Skewness

偏态系数绝对值值越大,偏斜程度越厉害。
SK< 0 左偏
SK> 0 右偏

SK以mean、mode之差与σ的比例来计算的,因此mean>mode,也就是右偏的时候,SK>0。

三、峰度kurtosis

正态分布的峰度K=3,均匀分布的峰度K=1.8。
除了左偏右偏之外我们还需要从峰度上看峰度是否偏离了正态分布。

kurtosis=K-3 称为超值峰度
kurtosis>0,尖峰态(leptokurtic),数据集比较分散,极端数值较多
kurtosis<0,低峰态(platykurtic),数据集比较集中,两侧的数据比较少

相关链接:

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值