Hoeffding不等式及其在机器学习中的应用

参考   Hoeffding不等式及其在机器学习中的应用 - 云+社区 - 腾讯云

考虑二分类问题y\in \{ -1,+1\}和真实函数f, 假定基分类器的错误率为\epsilon, 即对每个基分类器h_i

                                                 P(h_i(x)\neq f(x))=\epsilon                                        (1)


假设集成通过简单投票法结合T个基分类器, 若有超过半数的基分类器正确, 则集成分类就正确:

                                                    H(x)=sian(\sum_{i=1}^Th_i(x))                                (2)
假设基分类器的错误率相互独立, 则由Hoeffding不等式可知, 集成的错误率为:

                            P(H(x)\neq f(x))=\sum_{k=0}^{|T/2|}\binom{T}{k}(1-\epsilon)^k\epsilon ^{T-k}\leq exp(-\frac{1}{2}T(1-2\epsilon)^2)                    (3)

Hoeffding不等式适用于有界的随机变量. 设有两两独立的一系列随机变量X1,...,Xn. 假设对所有的1≤i≤n, Xi都是几乎有界的变量, 即满足:

                                                P(X_i \in[a_i,b_i])=1                               (4)


那么这n个随机变量的经验期望:

                                                \overline{X}=\frac{X_1+\cdot \cdot \cdot + X_n}{n}                               (5)


满足以下的不等式:

                                                                    (6),(7)       

伯努利随机变量的特例

假定一个硬币A面朝上的概率为p, 则B面朝上的概率为1−p. 抛n次硬币, A面朝上次数的期望值为n∗p. 则A面朝上的次数不超过k次的概率为:

                                                                                (8)


H(n)为抛n次硬币A面朝上的次数

对某一ε>0当k=(p−ε)n 时, 有Hoeffding不等式

                                                                          (9)


对应的, 当k=(p+ε)n 时,

                                                                         (10)


由此可得

                                                               (11)


利用式(9)可推式(3)

式(3)的1−ϵ相当于式(9)的p , 令H(n)为基分类器分类正确的数量, 有     

                                                                            (12)

总分类器的数量为T(就是n), 令\frac{T}{2}=(1-\epsilon -\epsilon )T, 可推得\epsilon =\frac{1}{2}-\epsilon , 根据式(9)可得
 

                                                                (13)

便得到式(3)得最终不等式形式

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Wanderer001

ROIAlign原理

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值