描述性统计以及离群点处理

博客探讨了在数据挖掘过程中,描述性统计遇到的离群点问题及其对分析的影响。文章通过展示salary字段的偏度和峰度异常,指出存在离群点,并提供了两种处理方法:基于统计学方法(如z-score)和箱线图(IQR方法)。通过这些方法识别并去除离群点,以确保后续分析的准确性。
摘要由CSDN通过智能技术生成

需求:对数据进行描述性统计的过程中发现了可能存在离群点,离群点的存在会影响描述性统计以及后面的数据挖掘

症状:

【表四salary的偏度系数与峰度系数】

统计量

数值

平均值

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值