霍夫丁不等式

Hoeffding’s Inequality  (Wassily Hoeffding于1963年)

 

1. 如果我们选定一个二分分类器预测函数f,  假设将f按概率应用于整个样本空间, 某些预测会错误, 这样可以得到一个预测错误的比例,

这就是泛化误差。 因为我们实际上不可能测试无限的数据集,所以泛化误差实际是无法得到的。

当我们把f应用于一个已标记的测试集T, 同样可以得到一个预测错误的比例, 这个就是经验误差。

我们需要根据经验误差, 来估计泛化误差的范围, 从而确定f能否满足我们需要的精度。

 

2. 设测试集T的样本数量是n, 则每一个正确的预测, 对经验误差的贡献是0, 每一个错误的预测, 对经验误差的贡献是1/n.

    所以如果错误的数量是t, 则总的经验误差就是 t/n.

   即是: t/n =   0+0+...+1/n+0+...+1/n+0...  (共n-t个0, t个1/n)

 

3. 假设f对样本正误的判断随机的,是独立的, 那么这就是一个伯努利过程, 

    其数学期望就是泛化误差, 而经验误差就是实验取值。

    这样, 经验误差和泛化误差的偏离程度, 就可以用一个不等式来表示。

    这个就是 “Hoeffding不等式”.

    我们以此来根据 (1)测试集样本数量  (2)经验误差  来确定 (3)经验误差和泛化误差的差小于某个阈值 的 概率(置信度).

 

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值