异常值判断四分法_数据挖掘|Grubbs异常检验算法

Grubbs检测是一种异常值判断方法,适用于正态分布的数据集。它通过检验统计量判断是否存在异常值,如果满足特定条件则拒绝原假设,认为数据中有一个异常值。在实际应用中,Grubbs检测可能会因多次迭代而影响检测结果,不适用于小样本数据。文章提供了一个简单的介绍,并包含Grubbs检测的实例代码。
摘要由CSDN通过智能技术生成
0eec8662c5cd9f8b72aa112e5743d59b.png

如果感兴趣,欢迎点击上方“关注”,收藏和分享给身边好友!

定义

Grubbs检测,也称为最大归一化残差检测,常被用来检验服从正太分布的单变量数据集中的单个异常值。Grubbs检测基于正态假设。也就是说,在应用Grubbs检测之前,首先应验证数据是否可以通过正态分布合理地近似。

原理

Grubbs检测一次检测到一个异常值。从数据集中删除该异常值,并且迭代测试直到没有检测到异常值。但是,多次迭代会改变检测概率,并且检测不应该用于六个或更少的样本,因为它经常将大多数点标记为异常值。

假设检验

Grubbs测试是针对假设定义的:

H0:数据集中没有异常值

H1:数据集中只有一个异常值

Grubbs检测统计定义为:

9bf9f395603bf6c5af961ade99ab09c3.png

Y、s分别表示样本均值和标准差。Grubbs检验统计量是样本标准差单位与样本均值的最大绝对偏差。

原假设H0被拒绝,当检验统计量满足以下条件:

7ac8664e2d62714430ac530d0c58b0e3.png

实际上,Grubbs检测可理解为检验最大值、最小值偏离均值的程度是否为异常。

实例代码

Grubbs检验#---------------代码范例#Grubbs检验代码实例:#######################################################################函数功能:Grubbs检验#参数说明:x:要进行判断的数据#####################################################################library(outliers)grubbs
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值