无限的hypotheses 变成有限的dichotomies

最新推荐文章于 2019-06-06 20:33:15 发布

weixin_34370347

最新推荐文章于 2019-06-06 20:33:15 发布

阅读量82

点赞数

给定任意D，它是某些H的Bad Sample（即E_in和E_out不接近）的概率为：

即H中备选函数的数量M=|H|越少，样本数据量N越大，则样本成为坏样本的概率越小。在一个可接受的概率水平上，学习算法A只需要挑选那个表现最好的h作为g就行了。

挑选出最好的g需要满足两个条件：找到一个假设g使得E_out(g)和E_in(g)是非常接近的，使得E_in(g)足够小，

下面是BAD和M的关系：

因此选择一个合适的M是非常重要的，需要用一个有限的值m来替代一个非常无限的值M

思路：overlapping for similar hypotheses h1 ≈ h2 ，它们的E_in(h₁)≈E_in(h₂),E_out(h₁)≈E_out(h₂)(比如说PLA中的两条直线，相邻的很近的直线)=>union bound over-estimating

to account for overlap,we can group similar hypotheses by kind

h对D的一个Dichotomy(二分):备选函数集中的每一个函数h都是输入X到输出Y的一个映射：H={hypothesis h:X->{×,Ο}}将h(x1,x2,...,xN)=(h(x₁),h(x₂),...,h(x_N))∈{×,Ο}^N其中H(x₁,x₂,...,x_N)包含了所有对D的dichotomies。

hypotheses H 和dichotomies H(x₁,x₂,...,x_N)的区别：

growth function: remove dependence by taking max of all possible (x₁, x₂, . . . , x_N)

4个成长函数

break point：有k个输入，如果它不能被当前的备选函数集H shatter，那么k就是H的一个Break Point

weixin_34370347

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。