【数据预处理】3sigma原则离群值处理

在统计上,68–95–99.7法则(68–95–99.7rule)是在正态分布中,距平均值小于一个标准差、二个标准差、三个标准差以内的百分比,更精确的数字是68.27%、95.45%及99.73%。若用数学用语表示,其算式如下,其中X为正态分布随机变量的观测值,μ为分布的平均值,而σ为标准差:
P r ( μ − 1 σ ≤ X ≤ μ + 1 σ ) ≈ 0.682 Pr(\mu-1\sigma\leq X \leq \mu+1\sigma) \approx 0.682 Pr(μ1σXμ+1σ)0.682
P r ( μ − 2 σ ≤ X ≤ μ + 2 σ ) ≈ 0.954 Pr(\mu-2\sigma\leq X \leq \mu+2\sigma) \approx 0.954 Pr(μ2σXμ+2σ)0.954
P r ( μ − 3 σ ≤ X ≤ μ + 3 σ ) ≈ 0.997 Pr(\mu-3\sigma\leq X \leq \mu+3\sigma) \approx 0.997 Pr(μ3σXμ+3σ)0.997

在这里插入图片描述

  • 8
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值