数据异常值处理

在我们进行数据处理的时候,经常会遇到异常的数据点,偏离平均值或者中位数比较远的点,这种异常值我们可以通过以下三种方式进行处理:

1,3西格玛法,即计算出数据的均值以及标准差,距离均值3个标准差之外的点我们认为是异常点,大于均值加上3个标准差的点,我们将其赋值为均值加上3个标准差,小于均值减去3个标准差的点,我们将其赋值为均值减去3个标准差。

2,百分位法,我们认为97.5%分位数,以及2.5%分位数以外的点为异常点。

3,MAD法,先计算中位数,然后计算其他点离中位数的绝对距离,然后计算得到绝对距离的中位数,将该值记为MAD,则在中位数加减n个MAD以外的点,我们记为是异常点,n可以取5。

以上内容从以下链接总结得到:

https://www.ricequant.com/community/topic/4271/

  • 1
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值