机器学习进阶之（四）XGBoost-LightGBM

最新推荐文章于 2022-06-19 17:32:26 发布

Merlin17Crystal33

最新推荐文章于 2022-06-19 17:32:26 发布

阅读量449

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/qq_35495233/article/details/86763173

版权

本文回顾了XGBoost和LightGBM两种机器学习算法。介绍了XGBoost的Boosting思想、损失函数、正则化构建公式、泰勒展开公式以及寻找最优分裂点的算法流程。同时，对LightGBM的模型实例和参数实例进行了简要说明。

摘要由CSDN通过智能技术生成

1. 回顾XGboost

XGBoost在竞赛与工业界都使用频繁。XGBoost是决策树的一种，那么要使用决策树过程，下面有两个弱分类器，一个以年龄性别，另一个以是否使用电脑，这是一种集成的思想，我们利用叶子节点与权值来表示预测值。
在这里插入图片描述

1.1 Boosting思想

Boosting是一个加法模型，从常数开始迭代，每一轮迭代增加一个函数，每次新添加的函数是基于以往所有的学习结果的和与真实值之间的残差上学习模型。
$\vec y_i^{(0)} = 0$ $\vec y_i^{(1)}=f_1(x_i)=\vec y_i^{(0)} + f_1(x_i)$ $\vec y_i^{(2)}=f_1(x_i)+f_2(x_i)=\vec y_i^{(1)}+f_2(x_i)$ $. . .$ $\vec y_i^{(t)}=\sum_{k=1}^t f_k(x_i)=\vec y_i^{(t-1)}+f_t(x_i)$

1.2 XGBoost损失函数

XGBoost需要对每棵树都进行综合考虑，优化目标是一个损失函数。
我们的目标函数是： $l(y_i, \overline y_i)=(y_i - \overline y_i)^2$ ，那么我们如何求最优函数呢？ $F^*(\vec x)=argminE_{(x,y)}[L(y,F(\vec x))]$ 集成算法表示： $\vec y_i =\sum_{k=1} ^ K f_k(x_i), f \in F$