如果感兴趣,欢迎点击上方“关注”,收藏和分享给身边好友!
定义
Grubbs检测,也称为最大归一化残差检测,常被用来检验服从正太分布的单变量数据集中的单个异常值。Grubbs检测基于正态假设。也就是说,在应用Grubbs检测之前,首先应验证数据是否可以通过正态分布合理地近似。
原理
Grubbs检测一次检测到一个异常值。从数据集中删除该异常值,并且迭代测试直到没有检测到异常值。但是,多次迭代会改变检测概率,并且检测不应该用于六个或更少的样本,因为它经常将大多数点标记为异常值。
假设检验
Grubbs测试是针对假设定义的:
H0:数据集中没有异常值
H1:数据集中只有一个异常值
Grubbs检测统计定义为:
Y、s分别表示样本均值和标准差。Grubbs检验统计量是样本标准差单位与样本均值的最大绝对偏差。
原假设H0被拒绝,当检验统计量满足以下条件:
实际上,Grubbs检测可理解为检验最大值、最小值偏离均值的程度是否为异常。
实例代码
Grubbs检验#---------------代码范例#Grubbs检验代码实例:#######################################################################函数功能:Grubbs检验#参数说明:x:要进行判断的数据#####################################################################library(outliers)grubbs