GBDT、XGBoost、LightGBM算法公式推导

最新推荐文章于 2023-06-21 16:07:04 发布

Flame卡夫卡

最新推荐文章于 2023-06-21 16:07:04 发布

阅读量4.9k

点赞数 2

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/u012991103/article/details/82913303

版权

本文详细介绍了GBDT、XGBoost和LightGBM算法的公式推导。首先，对GBDT的损失函数进行了分析，求得了第一个基函数F0(X)的表达式，并通过泰勒展开确定了最优叶子节点的取值。接着，针对XGBoost，展示了其目标函数的泰勒展开形式，特别讨论了logitloss损失函数的两种形式及其导数。最后，提到了LightGBM的相关内容。这些推导对于理解这些机器学习算法的工作原理至关重要。

摘要由CSDN通过智能技术生成

一、GBDT公式推导

1、第一个基函数：
$F_0(X)=\frac{1}{2}log\frac{1+\overline{y}}{1-\overline{y}} \tag{1.1}$
对于损失函数 $F)=log(1+e^{-2yF}), y\in \left\{-1, 1\right\}$ ，求损失函数最小对应的 $F$ 值。求一阶导数：
$L^{'}=\frac{-2ye^{-2yF}}{1+e^{-2yF}} \tag{1.2}$
设
$\begin{cases} &count(y=+1)=m1\\ &count(y=-1)=m2 \end{cases} \tag{1.3}$
则有
$\begin{cases} m1+m2=n\\ \frac{m1-m2}{n}=\overline{y} \end{cases} \tag{1.4}$
即
$\begin{cases} m1=\frac{n}{2}(1+\overline{y})\\ m2=\frac{n}{2}(1-\overline{y}) \end{cases} \tag{1.5}$
令 $\sum{L^{'}=0}$ 得到,
$\sum{L^{'}=\sum_{y=1}L^{'}+\sum_{y=-1}L^{'}=0} \tag{1.6}$
将 $(1.5)$ 带入 $(1.6)$ ，得到，
$\begin{aligned} L^{'}&=\sum_{y=1}L^{'}+\sum_{y=-1}L^{'}\\\\ &=\frac{n}{2}(1+\overline{y})*\frac{-2e^{-2F}}{1+e^{-2F}} + \frac{n}{2}(1-\overline{y})*\frac{2e^{2F}}{1+e^{2F}}\\\\ &=\frac{n}{2}(1+\overline{y})*\frac{-2}{1+e^{2F}} + \frac{n}{2}(1-\overline{y})*\frac{2e^{2F}}{1+e^{2F}}\\\\ &=\frac{n}{1+e^{2F}}[-(1+\overline{y}) + e^{2F}(1-\overline{y})] \end{aligned} \tag{1.7}$