格拉布斯准则的应用(Python)

本文介绍了如何运用格拉布斯准则来检测和移除数据中的异常值,通过计算Gi值并与格拉布斯临界值表对比,判断是否存在异常值。文章提供了一个Python函数Outliers_Remover,可以处理长度为17的列表,并根据置信等级进行异常值处理。
摘要由CSDN通过智能技术生成


前言

大家好,我又回来了ヽ( ̄▽ ̄)ノ

这次所带来的是格拉布斯(Grubbs)临界值表的应用

在我想比较两个数组的平均数的时候,发现一组数中非常大的数字会相当影响该组数的平均数,然后我也不想用中位数来进行代替 ̄へ ̄

所以,我就在想有什么科学的方法,能认定什么是一组数中非常大的数字(也就是异常值),然后我就可以把它剔除出去了( ̄▽ ̄)~*

果不其然,前人的智慧当中有“格拉布斯准则”这么一个很科学的方法剔除异常值

所以让我们话不多说,开始我们的讲解吧(* ̄︶ ̄)

一、格拉布斯准则是什么?

相信大家都可以在网络上找到相关的具体知识,在此就不在赘述。

总网络上的知识而言之,就是计算Gi值与格拉布斯临界值表上所对应的值GP(n)相比较,若Gi值大于GP(n)值则为异常,反之则不为异常

1.Gi值

Gi值的计算是该数字的残差除于标准差
G i = x i − x ˉ s Gi = \dfrac{x_i-\bar{x}}{s} Gi=sxixˉ

2.格拉布斯临界值表

我是在百度文库上找的图表,点击下方超链接浏览
格拉布斯临界值表

或复制链接自行浏览
https://wenku.baidu.com/view/cfce6d64c381e53a580216fc700abb68a882ad48.html

二、使用步骤

1.引入代码

def Average_Number(List):
    return sum(Lis
  • 4
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 5
    评论
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值