提升方法就是从弱学习算法出发,反复学习,得到一系列弱分类器,然后组合得到一个强学习分类器。
提升策略
- 如何改变训练数据集的权重或者概率分布?
提高那些被前一轮弱分类器错误分类样本的权重。 - 如何将弱学习分类器组合成一个强学习分类器?
采取加权表决的方法,加大分类误差率小的弱分类器的权值。
算法细节
- 初始训练数据权值分布
D 1 = ( w 11 , … , w 1 i , … , w i N ) , w 1 i = 1 N , i = 1 , 2 , ⋯   , N D_1 = (w_{11},\dots,w_{1i},\dots,w_{iN}),w_{1i} = \frac{1}{N},i=1,2,\cdots,N D1=(w11,…,w1i,…,wiN),w1i=N1,i=1,2,⋯,N - 使用具有权值分布 D m D_m Dm的训练数据集学习,得到基学习器
G m ( x ) : X → { − 1 , + 1 } G_m(x) : X\to \{-1,+1\} Gm(x):X→{ −1,+1} - 计算 G m ( x ) G_m(x) Gm(x)在训练集上的分类误差率
e m = ∑ i = 1 N P ( G m ( x i ) ≠ y i ) = ∑ i = 1 N w m i I ( G m ( x i ) ≠ y i ) e_m = \sum_{i=1}^N P(G_m(x_i) \neq y_i) = \sum_{i=1}^N w_{mi}I(G_m(x_i) \neq y_i) em=i=1∑NP(Gm(xi)̸=yi)=i=1∑NwmiI(Gm(xi<