机器学习泛化误差上界补充推导

最新推荐文章于 2023-02-04 10:41:32 发布

HEGSNS

最新推荐文章于 2023-02-04 10:41:32 发布

阅读量296

点赞数

文章标签：机器学习深度学习

本文链接：https://blog.csdn.net/HEGSNS/article/details/115628839

版权

CSDN博文https://blog.csdn.net/SanyHo/article/details/105569224 已经给出了较为详细的推导过程，这里只给出由Hoeffding不等式退出如下不等式：
$\mathbb{P}(R(f) − \hat{R}(f) \geq \epsilon) \leq exp(−2N \epsilon^2)$
的过程。

Hoeffding不等式为
$\mathbb{P} (\mathbb{E} S_n - S_n \geq t) \leq exp(\frac{-2t^2}{\sum_{i=1}^N (b_i - a_i)^2})$ ,
其中 $S_n = \sum_{i=1}^N Z_i$ 为 $N$ 个iid随机变量之和。

而 $\mathbb{E} Loss(X, f(X))$ （期望值）, $\hat{R}(f) = \frac{1}{N} \sum_{i=1}^N Loss(X_i, f(X_i))$ （均值）。这里考虑 $Z_i = Loss(X_i, f(X_i))$ ，并且loss的上下限为 $\leq Loss(X_i, f(X_i)) \leq L$ ，带入Hoeffding不等式，有：

$\mathbb{P} (\frac{1}{N} \mathbb{E} \sum_{i=1}^N Z_i - \frac{1}{N} \sum_{i=1}^N Z_i \geq t) = \mathbb{P} (\mathbb{E} \sum_{i=1}^N Z_i - \sum_{i=1}^N Z_i \geq Nt) \leq exp(\frac{−2 N^2 t^2}{N L^2} )$

把 $t$ 换成 $\epsilon$ 就得到了
$\mathbb{P}(R(f) − \hat{R}(f) \geq \epsilon) \leq exp(−\frac{2N \epsilon^2}{L^2})$
或者写成
$\leq \hat{R}(f) + \sqrt{ -\frac{ L^2 \log \gamma}{2 N} }$
以概率 $1-\gamma$ 成立。

HEGSNS

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习泛化误差上界补充推导

CSDN博文https://blog.csdn.net/SanyHo/article/details/105569224 已经给出了较为详细的推导过程，这里只给出由Hoeffding不等式退出如下不等式：P(R(f)−R^(f)≥ϵ)≤exp(−2Nϵ2)\mathbb{P}(R(f) − \hat{R}(f) \geq \epsilon) \leq exp(−2N \epsilon^2)P(R(f)−R^(f)≥ϵ)≤exp(−2Nϵ2)的过程。Hoeffding不等式为P(ESn−Sn≥t)≤e
复制链接

扫一扫