方法原理:
3σ准则又称为拉依达准则,它是先假设一组检测数据只含有随机误差,对其进行计算处理得到标准偏差,按一定概率确定一个区间,认为凡超过这个区间的误差,就不属于随机误差而是粗大误差,含有该误差的数据应予以剔除。
在正态分布中σ代表标准差,μ代表均值。x=μ即为图像的对称轴
3σ原则:
数值分布在(μ-σ,μ+σ)中的概率为0.6827
数值分布在(μ-2σ,μ+2σ)中的概率为0.9544
数值分布在(μ-3σ,μ+3σ)中的概率为0.9974
可以认为,Y 的取值几乎全部集中在(μ-3σ,μ+3σ)区间内,超出这个范围的可能性仅占不到0.3%。
示例数据:
日期 | 商品编码 | 销售数量 | |
---|---|---|---|
0 | 2020-12-01 | A005 | 1 |
1 | 2020-12-01 | A014 | 2 |
2 | 2020-12-01 | A007 | 3 |
3 | 2020-12-01 | A012 | 4 |
4 | 2020-12-01 | A009 | 5 |
5 | 2020-12-01 | A019< |