二项检验

最新推荐文章于 2024-07-11 15:43:20 发布

loyxCCS

最新推荐文章于 2024-07-11 15:43:20 发布

阅读量9k

点赞数 15

分类专栏：机器学习

本文链接：https://blog.csdn.net/loyxCCS/article/details/94660689

版权

机器学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

文章目录

检验原理
$\bar\epsilon$的计算
$\hat\epsilon$无偏估计证明

西瓜书2.4节提到了二项检验，看不太懂。参考网上其他人的想法后，记录一下自己的理解。
以下内容也包含着自己对假设检验的理解。

检验原理

对于一个学习器的泛化错误率 $\epsilon$ ,我们做出一个猜想（假设）： $\epsilon\le\epsilon_0$ 。

那么如何知道这个猜想对不对呢？假如我们已知 $\epsilon$ 的值，那么只需将 $\epsilon$ 与 $\epsilon_0$ 比大小就能得知猜想是否正确。但问题是，一个学习器的泛化错误率并不能事先得到。我们只能得到这个学习器的测试错误率 $\hat\epsilon$ 。

虽然 $\epsilon$ 未知，但我们可以用 $\hat\epsilon$ 检验我们的猜想。这是因为 $\hat\epsilon$ 在一定程度上反应了 $\epsilon$ 的大小。西瓜书上给出这两者的联合概率质量函数 $P(\hat\epsilon;\epsilon)=\binom{m}{\hat\epsilon*m}\epsilon^{\hat\epsilon*m}(1-\epsilon)^{m-\hat\epsilon*m}$ 由此我们可以证明出 $\hat\epsilon$ 是 $\epsilon$ 的无偏估计，证明在这。这就说明，如果 $\epsilon\le\epsilon_0$ ，那么 $\hat\epsilon$ 在大概率上也小于 $\epsilon_0$ ，而在小概率上远大于 $\epsilon_0$ 。

假设检验的基本原理是小概率原理，即“概率很小的事件在一次试验中可认为几乎不会发生”。因此，如果“ $\hat\epsilon$ 远大于 $\epsilon_0$ ”这个小概率事件发生，我们就认为假设不对。但问题是， $\hat\epsilon$ 需要大于多少我们才能怀疑我们的假设不对?

形式化的来说，当 $P\{\hat\epsilon \ge \bar\epsilon|\epsilon \le\epsilon_0\}<\alpha$ ，这个小概率事件( $\alpha$ 很小，通常为0.1,0.05)发生时，我们拒绝假设" $H_0:\epsilon \le \epsilon_0$ "。那么现在只要求出 $\bar \epsilon$ ，我们就能用 $\hat\epsilon$ 与 $\bar\epsilon$ 比大小，确定猜想是否正确。

$\bar\epsilon$ 的计算

$\bar\epsilon$ 的计算过程应该能反应出 $\epsilon \le\epsilon_0$ 这一猜想。为了求出这个边界，我们可以求 $\epsilon =\epsilon_0$ 所对应的 $\bar\epsilon$ 。因为这样求出的 $\bar\epsilon$ ， $\{\hat\epsilon \ge \bar\epsilon\}$ 对 $\epsilon =\epsilon_0$ 来说是一个小概率事件，那么对 $\epsilon \le\epsilon_0$ 更是一个小概率事件。

这样 $\bar\epsilon$ 可由以下公式算出
$\bar\epsilon=\min\hat\epsilon \\s.t.\ \sum_{i=\hat\epsilon*m+1}^{m}\binom{m}{i}\epsilon_0^{i}(1-\epsilon_0)^{m-i} < \alpha$

注意此处的 $\min$ 在书中为 $\max$ ，不过在《机器学习》上已经更正。

$\hat\epsilon$ 无偏估计证明

$\begin{aligned} \because P(\hat\epsilon;\epsilon)&=\binom{m}{\hat\epsilon*m}\epsilon^{\hat\epsilon*m}(1-\epsilon)^{m-\hat\epsilon*m} \\ \therefore E(\hat\epsilon) &= \sum_{i=0}^{m}\hat\epsilon P(\hat\epsilon;\epsilon)\\ & = \frac{1}{m} \sum_{i=0}^{m}i \binom{m}{i}\epsilon^{i}(1-\epsilon)^{m-i}\\ &= \frac{1}{m} \sum_{i=1}^{m} m\epsilon\binom{m-1}{i-1}\epsilon^{i-1}(1-\epsilon)^{m-i}\\ &=\epsilon\sum_{i=1}^{m} \binom{m-1}{i-1}\epsilon^{i-1}(1-\epsilon)^{(m-1)-(i-1)}\\ &=\epsilon[\epsilon + (1-\epsilon)]^{m-1}=\epsilon \end{aligned}\\ \therefore \hat\epsilon是\epsilon的无偏估计$

loyxCCS

关注

15
点赞
踩
50

收藏

觉得还不错? 一键收藏
6
评论
二项检验

文章目录检验原理西瓜书2.4节提到了二项检验，看不太懂。参考网上其他人的想法后，记录一下自己的理解。以下内容也包含着自己对假设检验的理解，内容会比较冗长。检验原理对于一个学习器的泛化错误率ϵ\epsilonϵ,我们做出一个猜想（假设）：ϵ≤ϵ0\epsilon\le\epsilon_0ϵ≤ϵ0。那么如何知道这个猜想对不对呢？假如我们已知ϵ\epsilonϵ的值，那么只需将ϵ\epsil...
复制链接

扫一扫