训练数据的充分性(2)：分类器的一致收敛

最新推荐文章于 2021-09-03 14:34:24 发布

汪星人来地球

最新推荐文章于 2021-09-03 14:34:24 发布

阅读量545

点赞数

分类专栏：机器学习文章标签：机器学习分类器训练

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hedan2013/article/details/77924018

版权

本文探讨机器学习中，当训练数据足够大时，即使训练误差不为0，也能使训练误差与实际误差无限接近的理论，提供了一种通过训练误差估算实际误差的方法。定理8阐述了这一概念，对于理解模型的有效性和训练数据规模的关系具有重要意义。

摘要由CSDN通过智能技术生成

在上一篇博文中提到，如果训练数据的规模充分大，那么当训练错误为0时，真正错误会趋近于0。这是机器学习训练算法有效性的理论依据。但是，在实际设计模型时，我们很难找到一个分类器，其训练错误为0。为此，本文介绍训练数据充分性的第二个引理。它的结论是当训练数据更大一些时，训练错误与实际错误可以无限接近。这样，我们就可以利用训练错误来估计实际错误了。

定理8. 设 $\mathcal{H}$ 是一个分类器集合。令 $\epsilon$ 和 $\delta$ 是正实数。假设 $S$ 是一个由n个随机实例构成的随机训练集合。每个实例都以分布D从实例空间中独立同分布地获得。那么当

n > 1 2 ϵ 2 ln (| H | + 1 δ)

$n>\frac{1}{2\epsilon^2}\ln (|\mathcal{H}|+\frac{1}{\delta})$
时，以概率

>1−δ $>1-\delta$ , 有

| e r r S (h) - e r r D (h) | < ϵ

$|err_S(h)-err_D(h)| < \epsilon$
对所有的

h∈H $h\in\mathcal{H}$ 成立。更确切地说：

Pr {\cap h \in

最低0.47元/天解锁文章

汪星人来地球

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。