[机器学习]集成学习简单投票法概率

基于周志华的西瓜书(p.172)解释集成学习简单投票法概率。并参考知乎董豪晨的回答
对于二分类问题 y=[1,1] ,假设错误率为 q ,且真实集函数表达为f(x),对于每个分类器 hi 有:

P(hif(x))=q
则对于用简单投票法和T个分类器,超过半数的分类器分类正确,则集成分类就正确:
H(x)=sign(i=1Thi(x))
证明:
由Hoeffding不等式(霍夫丁不等式):

若硬币正面朝上概率为 p ,反面朝上概率为1p=q,令 H(n) 为抛硬币 n 次硬币所得正面朝上的次数,则最多k次正面朝上的概率为:

P(H(n)k)=i=0kCinpi(1p)ni
δ>0K=(pδ)n ,则有:
P(H(n)(pδ)n)e2δ2n

若要正确分类率 H(x) >0.5(即至少有T/2个分类器分类正确),应该满足公式:
P(H(n)(pδ)T/2)e2δ2n
上式中 (pδ)T=[T2] ,所以有
δ=p1T[T2]p12=2p12=12q2
δ>0 ,所以
p1T[T2]0
因此要使超过一半的分类器分类正确,则 p0.5 ,因而超过半数的分类器分类正确,则集成分类就正确。
δ=12qq
P(H(n)T2)=i=0T2Cinpi(1p)Tie2(12q)2T=eT2(12q)2
由上式可知,在每个分类器相互独立情况下,随着分类器数量T的增加,集成的错误率趋向于0。

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值