二项检验,假设检验

 

目录

什么是“假设检验”?

什么是“二项检验”?

怎么计算假设的置信度?

《机器学习(周志华)》2.4.1节“二项检验”的具体分析


在学习《机器学习(周志华)》第2章 2.4.1节时遇到一个术语“二项检验(binomial test)”,不是特别理解,于是查阅了一下资料,了解了一下,有的博客解释的很繁杂,我认为没有那么复杂,我认为“二项检验”就是一个“假设检验”的问题,理解了假设检验的概念及运行机制就都了解了。以下是我的理解,如有不对还望校正。

 

什么是“假设检验”?

前提:1)我们知道一个分布的具体形式,但不知道分布的具体参数。例子(1)我们知道这个分布是一个二项分布,但是我们不知道这个二项分布的具体参数(二项分布只有一个参数,就是正样本的概率p)。例子(2)我们知道一个分布是高斯分布,但是我们不知道这个高斯分布的参数(均值或方差)。

           2)我们有一组服从这个分布的样本

“假设”:我们这个分布的参数的取值范围做了一个假设,比如这个参数大于/小于某个值,或这个参数偏离某个数值的距离小于某个阈值等。这个取值范围是需要人工指定的。

“检验”:根据手里的样本数据,计算假设的条件成立的置信度(即可信任程度)。

备注:“假设”与“检验”中我们总共涉及两个数值:在“假设”的条件中的“阈值”(或称取值范围),在“检验”中的“置信度”。这两个数值可以互相推断,在实际中必须人工指定其中一个,然后推断另外一个,然后将推断值与设定的标准值进行比较,从而判断假设是否成立。即,这两个数值都需要人工设定,其中一个出现在“假设”的条件里,另外一个出现在“检验”的标准里。 “假设检验”的最终输出是一个结论:在这个设定的检验标准下,这个假设的条件是否成立,是一个bool变量。

假设的条件与检验的标准在实际应用中是可以互换的。(1)可以指定假设的条件,推断这个具体假设成立的置信度,然后与设定的置信度比较,低于设定的置信度就认为不可信,反之认为可信。 (2)可以先指定置信度,推断满足这个置信度的最宽松的条件,如果假设的条件满足这个最宽松的条件(或换句话说,假设的条件比这个最宽松的条件还要严格),那么说明假设的条件比这个推断出的最宽松的条件的置信度还要高,所以假设成立,反之假设不成立。

什么是“二项检验”?

“二项检验”是“假设检验”中的一种情况:我们知道一个分布服从二项分布,但是不知道这个分布的参数p(正样本出现的概率)。我们手里有一批服从这个分布的样本,我们可以根据这批样本对这个参数的取值范围做一个假设,并设定一个置信度阈值,如果这个假设的可信度超过这个置信度阈值,我们就认为这个假设成立,否则认为不成立。

怎么计算假设的置信度?

根据手里的样本数据,我们可以对这个参数计算出一个“估计值”。根据这个估计值,我们可以得到这个二项分布的估计分布,很明显,这个分布是一个关于这个参数的函数,可以在"XOY"坐标系上,X轴表示参数的取值,Y轴表示分布函数的分布概率密度。假设的条件的置信度就是:在假设中设定的参数的取值范围的约束下,分布曲线下的积分面积。

《机器学习(周志华)》2.4.1节“二项检验”的具体分析

这里二项分布的未知参数是模型的真实泛化误差\epsilon

做出的假设是\epsilon \leqslant 0.3,(也可以表示为\epsilon \leqslant \epsilon_0,其中\epsilon_0是人工指定的一个条件)

检验的标准是:假设的置信度>设定的置信度阈值 1-\alpha (\alpha的术语是“显著性水平”,可以理解为条件“是否明显错误的判断标准”,所以1-\alpha可以理解为“非明显错误的判断标准”,即,“可信任的标准”,我称为“置信度阈值”。\alpha通常取一个较小的数值,如0.1,0.05,0.01,0.005等)

书中的假设检验的思路是:根据检验标准(即置信度阈值),推断参数可信任的候选区间,如果设定的条件在可信任的候选区间内,则认为条件成立,否则不成立。

 

参考:《机器学习(周志华)》2.4.1节

            《概率论与数理统计(第四版,盛骤 等编)》第8.1节

  • 24
    点赞
  • 45
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值