【机器学习习题】估计一个模型在未见过的数据上的性能

最新推荐文章于 2024-05-16 22:43:06 发布

圈圈圈小明

最新推荐文章于 2024-05-16 22:43:06 发布

阅读量534

点赞数 1

文章标签：机器学习算法人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wenxi2367/article/details/132905196

版权

您提到的不等式是统计学中的泛化误差界（generalization error bound），它用于估计一个模型在未见过的数据上的性能。这个不等式是由Hoeffding不等式和Union Bound组合而成的。在这个不等式中，我们有以下符号：

- P[|E_in(g) - E_out(g)| > ε]：这是泛化误差超过ε的概率。
- ε：可容忍的差值。
- M：假设模型类别的大小（例如，假设我们正在训练的模型有多少个可能的候选）。
- N：数据集的大小。
- δ：可容忍的BAD概率（也称为置信度）。
- c：一个常数，通常设置为1。

您的目标是找到一个数据集的大小N，以便满足给定的ε和δ，并保证泛化误差不会超过ε。

根据不等式，我们可以设置：

P[|E_in(g) - E_out(g)| > ε] ≤ 2*M*exp(-2*ε^2*N)

然后，我们可以将这个概率与可容忍的BAD概率δ相等，以找到数据集的大小N：

2*M*exp(-2*ε^2*N) = δ

现在，您提供了ε=0.1，δ=0.05，M=100。我们可以将这些值代入上述方程，并解出N：

2*100*exp(-2*0.1^2*N) = 0.05

现在，我们来解这个方程以找到N：

exp(-2*0.1^2*N) = 0.05 / (2*100)

exp(-2*0.01*N) = 0.00025

使用自然对数的性质，我们可以继续解这个方程：

-2*0.01*N = ln(0.00025)

N = ln(0.00025) / (-2*0.01)

N ≈ 6907.76

因此，需要大约6908个数据点来满足给定的ε=0.1和δ=0.05，以确保泛化误差不会超过0.1。

请注意，这个结果是一个估计值，实际情况可能会受到数据分布和模型选择等因素的影响。此外，对于不同的问题和模型，可能需要不同的训练数据量来满足给定的泛化误差和置信度要求。

圈圈圈小明

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
【机器学习习题】估计一个模型在未见过的数据上的性能

您提到的不等式是统计学中的泛化误差界（generalization error bound），它用于估计一个模型在未见过的数据上的性能。此外，对于不同的问题和模型，可能需要不同的训练数据量来满足给定的泛化误差和置信度要求。因此，需要大约6908个数据点来满足给定的ε=0.1和δ=0.05，以确保泛化误差不会超过0.1。您的目标是找到一个数据集的大小N，以便满足给定的ε和δ，并保证泛化误差不会超过ε。：假设模型类别的大小（例如，假设我们正在训练的模型有多少个可能的候选）。：一个常数，通常设置为1。
复制链接

扫一扫

圈圈圈小明 CSDN认证博客专家 CSDN认证企业博客

码龄8年

330: 原创

3万+: 周排名

1万+: 总排名

26万+: 访问

: 等级

4188: 积分

109: 粉丝

115: 获赞

35: 评论

309: 收藏

私信

关注

热门文章

分类专栏

最新评论

通过xshell连接aws的ec2服务器，已经有密钥
free_pp: 再最新版本的xshell7中，高级身份验证窗口从哪里可以打开呢
极点战法笔记
2301_81380333: 翰林老师的课我学过，算是很经典的战法，成功率能达到82%左右吧，但是要找到符合全部条件的真的很少，基本上一个月就也就3只左右！
安装完整版streamSets
一起随缘: 你好，请问你有streamsets3.14.0版本包含完整安装包的rpm包吗，我用docker安装之后缺少jdbc-lib、mysql-binlog-lib、kafka-lib等好多组件包，希望能给指点下，非常感谢
【机器学习习题】估计一个模型在未见过的数据上的性能
白话机器学习: 文章写得专业、深入、详细，收藏啦
配置nginx常用命令
哲涯: 老哥这一行颇有深意呀： sudo nginx -t && sudo nginx -s reload

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。