Grubbs’检验用于检测遵循近似正态分布的单变量数据集中的单个异常值。该检验可以定义为单尾和双尾。
单尾Grubbs’检验:
此检验检查数据集一端的异常值。它可以定义为以下单侧检验之一:
检验最小值是否为异常值:G=sYˉ−Ymin
检验最大值是否为异常值:G=sYmax−Yˉ
其中,Yˉ是样本均值,s是样本标准差,Ymin是最小值,Ymax是最大值。
双尾Grubbs’检验:
此检验检查数据集两端的异常值。双尾检验的Grubbs’检验统计量为:
G=smax∣Yi−Yˉ∣
其中,Yi是数据集中的一个值。
在这两种情况下,如果计算出的G值大于临界值,那么就拒绝零假设(数据集中没有异常值),并认为最大值或最小值是异常值。
请注意,只有当你怀疑有一个异常值时,才推荐使用Grubbs’检验。如果你怀疑有多个异常值,建议使用Tietjen-Moore检验或广义极端学生化偏差检验。