机器学习基石 4.4 Connection to Real Learning

最新推荐文章于 2019-09-11 00:26:30 发布

我成为一只小羊

最新推荐文章于 2019-09-11 00:26:30 发布

阅读量529

点赞数

文章标签：机器学习机器学习基石

版权声明：本文为博主原创文章，遵循 CC 4.0 BY 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Exupery_/article/details/75370616

版权

文章目录

1. Multiple $h$
2. Coin Game
3. BAD Sample and BAD Data
4. The ‘Statistical’ Learning Flow
5. Fun Time

1. Multiple $h$

如果有一个 $h$ 在手上的资料中没有犯错（全是绿色的弹珠），即 $E_{in}(h_{M})=0$ ，能否说这个 $h$ 就是完美的？
这里写图片描述

2. Coin Game

不能，比如150个人一起抛硬币，出现一个5次全部正面的概率大于99%，但此时不能说这个5次全部正面的硬币有魔法。
这里写图片描述

3. BAD Sample and BAD Data

坏的样本指的是那些 $E_{in}$ 与 $E_{out}$ 相差很大的样本。

这里写图片描述

对于一个 $h$ 来说，坏的数据集指的是那些 $E_{in}(h)$ 与 $E_{out}(h)$ 相差很大的数据集。Hoeffding的理论告诉我们，这种情况发生的概率很小。

这里写图片描述

当 $h$ 有很多种选择时，坏的数据集指的是可能会在某个 $h$ 上 $E_{in}(h)$ 与 $E_{out}(h)$ 相差很大的数据集。

这里写图片描述

Hoeffding的理论只说明了对于一个 $h$ ，一个数据集是坏的的概率很小。

这里写图片描述

当有 $M$ 个 $h$ 时

这里写图片描述

这是Hoeffding在有限的bin上的版本。
同样不依赖于任何的 $E_{out}(h_{m})$ ，不需要知道 $E_{out}(h_{m})$ 。
所以 $E_{in}(g)=E_{out}(g)$ 大概是对的，并且与使用的Learning Algorithm无关。

这里写图片描述

所以最有效的算法就如同前面讲到的PLA或者pocket一样，选择 $E_{in}(h_{m})$ 最小的 $h_{m}$ 作为g。

这里写图片描述

4. The ‘Statistical’ Learning Flow

以上结论说明：如果 $\mathcal{H}$ 是有限的并且 $N$ 足够大，那么机器学习是可行的。

这里写图片描述

下一讲将讨论 $\mathcal{H}$ 无限大（比如perceptrons）的情形。

5. Fun Time

根据公式，3是对的。
2是对的，只添加一个负号并不会改变数据的好坏，正因如此，4是对的，相当于根据公式得到的 $M = 2$ 时的情形，添加负号后坏的数据集与原来的坏的数据集是一样的。

这里写图片描述

我成为一只小羊

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习基石 4.4 Connection to Real Learning

1. Multiple hh如果有一个hh在手上的资料中没有犯错（全是绿色的弹珠），即Ein(hM)=0E_{in}(h_{M})=0，能否说这个hh就是完美的？ 2. Coin Game不能，比如150个人一起抛硬币，出现一个5次全部正面的概率大于99%，但此时不能说这个5次全部正面的硬币有魔法。 3. BAD Sample and BAD Data坏的样本指的是那些EinE_{in}与Eou
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。