机器学习中假设函数泛化能力的验证（上）

最新推荐文章于 2022-11-05 15:47:02 发布

独步计院

最新推荐文章于 2022-11-05 15:47:02 发布

阅读量1.7k

点赞数

分类专栏：机器学习文章标签：函数机器学习应用数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sjkldjflakj/article/details/51887575

版权

机器学习专栏收录该内容

17 篇文章 0 订阅

订阅专栏

机器学习是通过现有的资料学习出一种假设函数，让这个假设函数尽可能的接近真实的函数。

那么我们如何验证假设函数与真是函数之间的关系？

对于一份验证数据D，我们把学习得到的假设函数h(x)应用到D上，会得到一个错误率。我们希望这个错误率与真实情况的错误率是接近的，这样当h(x)在我们所看到的资料上的错误率很低的时候，它在真实情况下的错误率也会很小。

原理就是霍夫丁不等式：

P [| v - u | \geq ϵ] \leq 2 e - 2 ϵ N

$P[|v-u|\ge\epsilon]\le2e^{-2\epsilon{N}}$

hoeffding 告诉我们，v是样本中事件A发生的比例，u是真实情况事件A发生的概率，那么这两个值相差很大的情况发生的概率是小于一个值的，而且这个值与样本数量有关系。

那么对于一个假设函数h(x)，当验证集也就是样本的规模很大的情况下。它的错误率接近真实情况。

然而我们要从多个h(x)中选择一个最好也就是错误率最小的作为g(x),那么我们怎么保证在多个h(x)中每一个的误差率 $E_{in}$ 与真实误差的误差率 $E_out$ 相差很近呢。因为有可能在 $h_t(x)$ 的 $E_{in}$ 很小但是 $E_out$ 就很大，所以我们希望对于所有的h(x), $E_{in}$ , $E_out$ 差距都不大。那么对于有M个h(x),
这里写图片描述
bad d 就是说， $E_{in}$ , $E_out$

这样我们就可以通过机器学习的算法在有限的H(x)中选择一个恰当的h(x),它的 $E_{in}$ 最小。
这里写图片描述

那么对于无穷的H（x）怎么办下次再讲。

我们注意到对于两个h(x)=sign(x), h(x) = sign(-x) 这两个的BAD D 是一样的因为只是翻转一下，正的变负，负的变正。

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
机器学习中假设函数泛化能力的验证（上）

机器学习是通过现有的资料学习出一种假设函数，让这个假设函数尽可能的接近真实的函数。那么我们如何验证假设函数与真是函数之间的关系？对于一份验证数据D，我们把学习得到的假设函数h(x)应用到D上，会得到一个错误率。我们希望这个错误率与真实情况的错误率是接近的，这样当h(x)在我们所看到的资料上的错误率很低的时候，它在真实情况下的错误率也会很小。原理就是霍夫丁不等式：P[|v−u|≥ϵ]≤2e−2ϵNP[
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。