机器学习 | 详解GBDT在分类场景中的应用原理与公式推导

TechFlow

于 2020-08-17 13:29:11 发布

阅读量520

点赞数

分类专栏：机器学习文章标签：机器学习 python 人工智能 GBDT

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/TechFlow/article/details/108054022

版权

本文深入探讨GBDT在分类场景中的应用，从逻辑回归损失函数出发，详细解释GBDT二分类的原理，包括训练过程、残差计算，并延伸至多分类问题。GBDT通过构建加法模型逼近损失函数，适用于广泛的分类任务，是机器学习中的强大工具。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文始发于个人公众号：TechFlow，原创不易，求个关注

今天是机器学习专题的第31篇文章，我们一起继续来聊聊GBDT模型。

在上一篇文章当中，我们学习了GBDT这个模型在回归问题当中的原理。GBDT最大的特点就是对于损失函数的降低不是通过调整模型当中已有的参数实现的，若是通过训练新的CART决策树来逼近的。也就是说是通过增加参数而不是调整参数来逼近损失函数最低点。

如果对于这部分不是很理解的话，可以通过下方的链接回顾一下之前的内容：

机器学习 | 详解GBDT梯度提升树原理，看完再也不怕面试了

逻辑回归损失函数

在我们开始GBDT模型原理的讲解和推导之前，我们先来回顾一下逻辑回归当中的相关公式和概念。

首先，我们先来写出逻辑回归的预测函数：

$h_{\theta}(x) = \frac{1}{1 + e^{-\theta^Tx}}$

图像画出来是这样的，其中的 $h_{\theta}(x)$ 表示表示了模型预测x这个样本属于类别1的概率。

在二分类问题当中，只有0和1两个类别，两个类别的概率只和为1。所以我们可以得到 $P(y=0|x;\theta)=1 - h_{\theta}(x)$ 。

我们希望模型在y=0的时候，使得 $h_{\theta}(x)$ 尽量大，否则则使得 $h_{\theta}(x)$ 尽量大，我们用指数的形式把两者综合写出了它的损失函数L。

$l(\theta) = -h_{\theta}(x)^y(1 - h_{\theta}(x))^{1-y}$

这个值涉及到指数，计算起来不太方便，所以我们会对它求对数进行简化。等式两边都取对数之后，可以得到：

$L(\theta)=log(l(\theta))=-\sum_{i=1}^N[y_i\log h_{\theta}(x_i)+(1 - y_i)\log (1 - h_{\theta}(x_i))]$

这个就是逻辑回归损失函数的由来。

GBDT二分类

我们将GBDT模型应用在二分类的场景当中的原理其实和逻辑回归一样，只不过在逻辑回归当中 $h_{\theta}(x)$ 是一个线性函数，而在GBDT当中， $h_{\theta} = \sum_{m=1}^M f_m(x)$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。