在无系统误差的情况下,测量中大误差出现的概率是很小的。在正态分布下,误差绝对值超过2.57σ(x)的概率仅为1%,误差绝对值超过3σ(x)的概率仅为0.27%≈1/370。对于误差绝对值较大的测量数据,就值得怀疑,可以列为可疑数据。可疑数据对测量值的平均值及实验标准偏差都有较大的影响,造成测量结果的不正确,因此在这种情况下要分清可疑数据是由于测量仪器、测量方法或人为错误等因素造成的异常数据,还是由于正常的大误差出现的可能性。首先,要对测量过程进行分析,是否有外界干扰,如电力网电压的突然跳动,是否有人为错误,如小数点读错等。其次,可以在等精度条件下增加测量次数,以减少个别离散数据对最终统计估值的影响。在不明原因的情况下,就应该根据统计学的方法来判别可疑数据是否是粗差。这种方法的基本思想是:给定一置信概率,确定相应的置信区间,凡超过置信区间的误差就认为是粗差,并予以剔除。用于粗差剔除的常见方法有莱特检验方法和格拉布斯检验方法。
1. 莱特检验方法
莱特检验法是一种正态分布情况下判别异常值的方法。判别方法如下:
假设在一列等精度测量结果中,第i项测量值xi所对应的残差vi的绝对值满足
,
则该误差为粗差,所对应的测量值xi为异常数值,应剔除不用。此处,残差: ,标准偏差估计:
(贝塞尔公式)。
本检验方法简单,使用方便,当测量次数n 较大时,是比较好的方法。一般适用于n>10 的情况,n<10 时,莱特检验法失去判别能力。
2. 格拉布斯Grubbs检验法
格拉布斯