一天一个统计小知识——3σ准则


前言

今天来聊一下统计学中用于检测异常值的“3σ准则”

一、3σ准则

什么叫3σ准则呢?其实它是用来粗略检测异常值的一种方法,类似的还有“1σ准则”“2σ准则”,下面进行具体说明。
在统计学中,如果一个变量服从正态分布,且它的均值是 u u u, 标准差是 σ σ σ,那么将有:

(1)68%的数据会落在 u u u ± σ 内,即数据分布在处于( u − σ u-σ uσ, u + σ u+σ u+σ)中的概率是0.68

(2)95%的数据会落在 u u u ± 2σ 内,即数据分布在处于( u − 2 σ u-2σ u2σ, u + 2 σ u+2σ u+2σ)中的概率是0.95

(3)99%的数据会落在 u u u ± 3σ 内,即数据分布在处于( u − 3 σ u-3σ u3σ, u + 3 σ u+3σ u+3σ)中的概率是099

所以当有一个数据落在均值( u u u) ± 三倍标准差(3σ) 外,我们可以初步把它看作是异常数据,这是因为数据落在均值( u u u) ± 三倍标准差(3σ) 外的概率只有1%,这种小概率的事件都发生了,我们就认为这个数据不是一个正常数据,换言之,它是一个异常数据。
tips:即使不是数据不服从正态分布,那么也有89%的数据落在均值的三个标准差范围内(出处忘记在哪了)

二、总结

“3σ准则”虽然简单,却可以粗略的检测异常数据,其他的相对复杂异常检测方法还有PCA法相似度法以及孤立森林等,后面再写一篇博客进行具体介绍。但是如果对精确要求不高,还是首选“3σ准则”,毕竟我们要遵守“奥卡姆剃刀原理”,即“如无必要,勿增实体”

  • 3
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 异常值分析是通过对数据进行统计分析,识别并排除异常值,从而提高数据的准确性和可信度。3σ原则是一种常用的异常值检测方法,它指的是在正态分布的数据,一般认为落在平均值加减3倍标准差范围之外的数据为异常值。通常,对于非正态分布的数据,可以采用其他的异常值检测方法。 ### 回答2: 异常值分析是数据分析的一项重要工作,主要用于检测和处理异常值。其,3σ原则是常用的方法之一。 3σ原则是基于正态分布的假设,假设数据符合正态分布,即大部分数据分布在均值附近,而极少数的数据为异常值。根据这一假设,通过计算数据的平均值和标准差,我们可以确定异常值的范围。 根据3σ原则,如果一个数据点的值与均值的差异超过3倍的标准差,那么这个数据点可以被认为是异常值。换句话说,如果一个数据点的值与均值的差异在3倍标准差以内,那么这个数据点可以被认为是正常值。异常值的判断可以通过以下公式表示: 异常值 = |数据点的值 - 均值| > 3 x 标准差 通过使用3σ原则,我们可以有效地识别和排除异常值,从而提高数据的准确性和可靠性。通过将异常值排除在外,我们可以更好地进行数据分析和建模,以便获得更准确的结果。然而,需要注意的是,3σ原则只是一种基本方法,对于不符合正态分布的数据,可能需要使用其他的异常值检测方法。 总之,异常值分析——3σ原则是一种常用的异常值检测方法,通过判断数据点与均值的差异是否超过3倍的标准差来确定异常值。这种方法可以帮助我们提高数据的准确性和可靠性,但在实际应用,需要结合具体情况和其他方法进行综合分析。 ### 回答3: 异常值分析是数据分析一个重要步骤,可以帮助我们识别出数据的异常点或异常值。其,3σ原则是一种常用的异常值分析方法。 3σ原则是基于正态分布的假设,在正态分布,大约68.27%的数据落在一个标准差内,95.45%的数据落在两个标准差内,99.73%的数据落在三个标准差内。根据这个规则,我们可以判断是否存在异常值。 具体分析步骤如下: 1. 计算数据的均值μ和标准差σ。 2. 确定上下阈值,上阈值为μ+3σ,下阈值为μ-3σ。 3. 将数据与上下阈值进行比较,超出上下阈值的数据被认为是异常值。 使用3σ原则进行异常值分析的好处是简单易懂,同时能够排除大部分正常数据。但这个方法也有一定的局限性,因为它假设数据服从正态分布,而实际数据可能存在其他类型的分布。因此,在使用3σ原则进行异常值分析时,我们需要根据具体情况来判断是否适用。 总之,异常值分析的目的是帮助我们找出可能会影响数据分析结果的异常点,3σ原则是一种常用的方法,但在具体使用时需要注意适用性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值