集成学习

bagging

数据集:有放回地随机抽取m个样本组成一个训练集
分类器:多个训练集生成多个分类器,这个过程可以并行
聚合:最终决策通过多个分类器投票表决产生

  • 多数表决的理论说明:(统计学习方法中用来分析最近邻的多数表决)
    若分类的损失函数为0-1损失函数,分类函数为
    \[\it{f}: \mathbb{R}^n \rightarrow \{c_1,c_2,...,c_k\} \]
    误分类的概率为
    \[P\,(Y\neq\it{f}\,(X)) = 1 - P(Y = \it{f}\,(X))\]
    k个分类器投票表决的误分类概率
    \[\frac{1}{k}\sum\limits_{x_i \in N_{\,k}(x)} I(y_i\neq c_j) = 1 - \frac{1}{k}\sum\limits_{x_i \in N_{\,k}(x)}I(y_i = c_j)\]
    要使误分类率最小即经验风险最小,即使\(\sum\limits_{x_i \in N_{\,k}(x)}I(y_i = c_j)\)最大,所以多数表决规则等价于经验风险最小化
boosting
stacking
Ref:

《统计学习方法》

转载于:https://www.cnblogs.com/alilliam/p/11504473.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值