关于Hoeffding不等式及泛化误差上界

最新推荐文章于 2023-09-22 14:56:47 发布

微丶念

最新推荐文章于 2023-09-22 14:56:47 发布

阅读量5.9k

点赞数 11

分类专栏：《统计学习方法》速读

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013745804/article/details/79522209

版权

《统计学习方法》速读专栏收录该内容

3 篇文章 0 订阅

订阅专栏

在监督学习中，我们通常会定义一个目标函数来衡量模型的好坏，定义一个风险函数从而计算模型预测结果与真实值之间的误差是一种惯用手段。一般而言，我们将考虑训练集上的训练误差和测试集上的泛化误差，事实上，训练误差的持续降低并不是那么令人愉快，因为这可能是“过拟合”在背后操纵着一切。总的来说，只有泛化误差的降低才能真的让人感觉美滋滋。

如果给我们一个模型，我们该从什么方面去降低泛化误差呢？等会讨论的泛化误差上界便对此进行了释疑。

首先我们囤一些知识：

1）损失函数：

2）期望风险：

3）经验风险：

4）Hoeffding不等式：

其中为独立随机变量之和，。

Hoeffding不等式有很多个版本，上面这个版本阐明了随机变量之和与与其期望偏差的概率上限。当然，我们也可以通过变量替换写为如下形式：

如果所有随机变量的范围都是[0, 1]，则b - a =1，此时有：

这样我们就得到了随机变量的均值与其期望偏差的概率上限。

下面我们举例对泛化误差的上界进行推导，以二类分类问题的泛化误差上界为例。

考虑二类分类问题，训练数据集是从联合概率分布中独立同分布产生的，。假设空间是函数的有限集合

，d为函数个数。设是从中选取的函数。损失函数是0-1损失。我们知道经验风险是N个独立随机变量的样本均值，并且期望风险是经验风险的期望值，因为是二分类问题，损失函数选择为0-1损失，所以损失函数取值于区间[0, 1]（事实上只取0或1），则由Hoeffding不等式的第二个版本可得（即关于均值的版本）：

我们知道是一个有限集合，而上面的式子表明了中的任意一个函数作为模型时的泛化误差的概率上限，如果要求中存在某个函数符合这一式子，则由概率的加和规则可得：

于是，我们可以得到：

进行变量替换：

得到：

也即说明，至少以概率有，假设我们找到了使经验风险最小的函数：

则有：

我们可以将期望风险看做泛化误差，而经验风险则是训练误差，那么由上式可知：1）训练误差越小，则泛化误差越小；2）样本容量N越大，则训练误差与泛化误差越接近；3）假设空间中包含的函数越多，则泛化误差上界越大。

事实上，关于泛化误差的上界关系式，最需要知道的是，N越大，则训练误差与泛化误差越接近。实际上这与我们通常理解的以经验频率去逼近概率或者以经验均值去逼近期望是一致的。

关注

11
点赞
踩
13

收藏

觉得还不错? 一键收藏
6
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

微丶念 CSDN认证博客专家 CSDN认证企业博客

码龄11年

87: 原创

9万+: 周排名

163万+: 总排名

46万+: 访问

: 等级

4703: 积分

502: 粉丝

522: 获赞

282: 评论

1350: 收藏

私信

关注

热门文章

分类专栏

LeetCode：Actions are more important than words 12篇
OpenAI Baselines源码阅读 1篇
TensorFlow理解与应用 3篇
机器人学 1篇
小白的CV学习记录
你好，强化学习
Baselines源码阅读 1篇
深度强化学习tips 3篇
David Silver强化学习课程笔记 9篇
PRML读书笔记
RL读书笔记
《统计学习方法》速读 3篇
机器人学
ROS学习 5篇
论文阅读与实现 4篇
LeetCode 12篇
Python学习笔记 21篇
菜鸟教程：Python 100例实践
TensorFlow学习笔记 6篇
深入TensorFlow 3篇
TFLearn学习笔记 4篇
OpenAI Gym学习笔记 7篇
Git学习笔记 2篇
C++学习笔记 2篇
《Effective C++》每日一条 3篇
《鸟哥的私房菜》学习笔记 1篇
算法实现 1篇

最新评论

关于VC维的理解
const LA: https://blog.csdn.net/qq_26547843/article/details/106288464这个讲的很清楚
Gym小记（五）
qq_35845146: 看看我的赛道3117 最佳941分 GYM CARRACING 人工智能 Selfattention 谷歌大脑自注意力赛车赛道3117,best performen 941分,可视化,焦点,_哔哩哔哩_bilibili
David Silver强化学习课程笔记（七）
z樾: 梯度上升.
David Silver强化学习课程笔记（五）
z樾: 是不是可以理解为如果是一步的话无论是greedy还是€greedy 选什么行为At获得什么Rt+1都其实只是一个概率而已可以理解没有区别，当多步的时候考虑到后续如Rt+2其实是由行为At+1导致的再往前推就是由At导致这是一个序列可以理解为是服从某种分布的序列，此时就无法忽视重要性采样了博主看理解对不对呢
David Silver强化学习课程笔记（一）
z樾: 1.其实就是所提到的奖励有延迟，因为奖励是理解为环境给出的，所以Agent在t时刻接收到obs(t)和R（t)做出A(t)，环境接收到A（t)再做出反馈，很明显由A(t)所导致的R是下一时刻的。2.预测，就是说给你一个策略，估计该策略能够得到多少回报，控制就是说从策略中到找一个回到最多的策略，所以网格中才是给出箭头（policy)而不是数字

大家在看

最新文章

目录

评论 6

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。