Boosting 是集成学习中非常重要的一类算法,其基本原理是串行生成一系列弱学习器(weak learner),这些弱学习器直接通过组合到一起构成最终的模型。主要的算法包括 AdaBoost 和 Gradient Boosting
基本思想
Gradient Boosting 的基本思想是:串行地生成多个弱学习器,每个弱学习器的目标是拟合先前累加模型损失的负梯度, 使得加上该弱学习器后的累加模型损失往先前累加模型损失的负梯度方向减少。因为是往负梯度方向,所以整体模型的损失降低的最快,因此每个弱学习器的训练目标就是拟合先前累加模型损失的负梯度
公式推导
假设有训练样本 ,,