什么是XGbbost
XGBoost是Extreme Gradient Boosting的简称,对应的模型就是一堆CART树,思想是将每棵树的预测值加到一起作为最终的预测值(可谓简单粗暴)。
下图就是CART树和一堆CART树的示例,用来判断一个人是否会喜欢计算机游戏:
图二说明了如何用一堆CART树做预测,就是简单将各个树的预测分数进行相加。
注:gboost为什么使用CART树而不是用普通的决策树呢?
简单讲,对于分类问题,由于CART树的叶子节点对应的值是一个实际的分数,而非一个确定的类别,这将有利于实现高效的优化算法。
XGboost的数学模型
y^=∑k=1Kfk