格拉布斯准则的应用
前言
大家好,我又回来了ヽ( ̄▽ ̄)ノ
这次所带来的是格拉布斯(Grubbs)临界值表的应用
在我想比较两个数组的平均数的时候,发现一组数中非常大的数字会相当影响该组数的平均数,然后我也不想用中位数来进行代替 ̄へ ̄
所以,我就在想有什么科学的方法,能认定什么是一组数中非常大的数字(也就是异常值),然后我就可以把它剔除出去了( ̄▽ ̄)~*
果不其然,前人的智慧当中有“格拉布斯准则”这么一个很科学的方法剔除异常值
所以让我们话不多说,开始我们的讲解吧(* ̄︶ ̄)
一、格拉布斯准则是什么?
相信大家都可以在网络上找到相关的具体知识,在此就不在赘述。
总网络上的知识而言之,就是计算Gi值与格拉布斯临界值表上所对应的值GP(n)相比较,若Gi值大于GP(n)值则为异常,反之则不为异常
1.Gi值
Gi值的计算是该数字的残差除于标准差
G i = x i − x ˉ s Gi = \dfrac{x_i-\bar{x}}{s} Gi=sxi−xˉ
2.格拉布斯临界值表
我是在百度文库上找的图表,点击下方超链接浏览
格拉布斯临界值表
或复制链接自行浏览
https://wenku.baidu.com/view/cfce6d64c381e53a580216fc700abb68a882ad48.html
二、使用步骤
1.引入代码
def Average_Number(List):
return sum(Lis