机器学习基石学习笔记3 VC Dimension（1）

最新推荐文章于 2022-12-27 21:16:49 发布

VIP文章 fengsser

最新推荐文章于 2022-12-27 21:16:49 发布

阅读量1.5k

点赞数

分类专栏： Machine learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/fengsser/article/details/48314251

版权

上章我们提到了当Ein与Eout足够接近，且Ein很小时，我们就能说机器学习确实学到了东西。而Ein低与否，与A在hypothesis set中的选择密切相关。当hypothesis set中的可选h(x) 越多，就越有可能找到一个让Ein很小的h(x)，然而M太多，却又会导致出现bad data的概率增大，导致|Ein-Eout|>ϵ

还记得我们用了一个不等式来衡量bad data出现的概率：

用一个不等式来衡量Ein和Eout是否接近

上述问题可以表示为：

1.我们是否可以确保Ein和Eout足够接近（hypothesis set中可选择的个数M有限，且N足够大）

2.我们是否可以把Ein弄得足够小（hypothesis set中可选择的个数M足够大）

而这两个问题中，M的数目是矛盾的。因此陷入了两难。

我们注意到，当M趋向于无限大时，bad data发生的概率会不断增大，因此我们不能处理M无限大的情况。为什么会这样呢，我们回想一下M是如何得出来的。

实际上，这里假

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习基石学习笔记3 VC Dimension（1）

上章我们提到了当Ein与Eout足够接近，且Ein很小时，我们就能说机器学习确实学到了东西。而Ein低与否，与A在hypothesis set中的选择密切相关。当hypothesis set中的可选h(x) 越多，就越有可能找到一个让Ein很小的h(x)，然而M太多，却又会导致出现bad data的概率增大，导致|Ein-Eout|>ϵ还记得我们用了一个不等式来衡量bad data出现的概率：
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。