一、XGBoost目标函数
首先认清一点,它是GBDT的升级版,由陈天奇发明,在效率、方法方面都进行了优化。
不管对于回归问题还是分类问题,好的机器学习方法的目的就是降低目标函数(也可称为损失函数)的值,目标函数包括2个部分:一是模型的损失函数,二是模型的复杂度。也就是目标函数具有下面的形式:
上面公式中,前者表示模型的损失函数的值,降低它是为了降低偏差,也就是使得预测的数据和真实的数据更为接近;后者表示这个模型的复杂度,是为了降低方差,增强模型的泛化能力。
对于XGBoost框架而言,以弱模型选择决策树(因为在XGBoost框架中,弱模型可以有多种选择,而在GBDT中,弱模型就是决策树)为例,来说