集成学习的基本步骤

集成学习的基本步骤

集成学习一般可分为以下3个步骤。

(1)找到误差互相独立的基分类器。

(2)训练基分类器。

(3)合并基分类器的结果。

合并基分类器的方法有voting和stacking两种。前者是用投票的方式,将获得最多选票的结果作为最终的结果。后者是用串行的方式,把前一个基分类器的结果输出到下一个分类器,将所有基分类器的输出结果相加(或者用更复杂的算法
融合,比如把各基分类器的输出作为特征,使用逻辑回归作为融合模型进行最后的结果预测)作为最终的输出。

以Adaboost为例,其基分类器的训练和合并的基本步骤如下。

(1)确定基分类器:这里可以选取ID3决策树作为基分类器。事实上,任何分类模型都可以作为基分类器,但树形模型由于结构简单且较易产生随机性所以比较常用。

(2)训练基分类器:假设训练集为 { x i , y i } , i = 1 , . . . , N , \{x_i,y_i\},i=1,...,N, { xi,yi},i=1,...,N其中 y i ∈ { − 1 , 1 } y_i\boldsymbol{\in}\{−1,1\} yi{ 1,1},并且有T个基分类器,则可以按照如下过程来训练基分类器。

1.初始化采分布
D l ( i ) = 1 / N D_{\mathrm{l}}(i)={1/N} Dl(i)=1/N
2.令 t = 1 , 2 , . . . , T t=1,2,...,T t=1,2,...,T循环:

  • 从训练集中,按照 D t D_t Dt分布,采样出子集 S t = { x i , y i } , i = 1 , … , N t ; S_{t}=\{x_{i},y_{i}\},i=1,\ldots,N_{t}; St={

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值