损失函数与梯度提升树

最新推荐文章于 2024-05-16 17:34:54 发布

LDOTN

最新推荐文章于 2024-05-16 17:34:54 发布

阅读量2.7k

点赞数 3

分类专栏：机器学习文章标签：机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/LDOTN/article/details/53588158

版权

本文深入探讨了机器学习中的损失函数，包括分类问题的0-1损失、指数损失、log损失、均方损失、hinge损失和偏差损失，以及回归问题的均方损失、绝对损失和Huber损失。接着，文章详细阐述了GBDT算法，解释了如何使用梯度提升方法处理各种损失函数，并分别讨论了在分类和回归问题中的应用。在分类中，GBDT默认采用偏差损失，而在回归问题中，通过拟合残差生成回归树。

摘要由CSDN通过智能技术生成

上一篇文章简单介绍了几种集成方法，以随机森林为代表的平均方法，以adaboost、提升树为代表的提升方法。本文继续提升树的讨论，采用梯度提升算法，分析更一般的损失函数下的分类、回归问题。首先介绍几种在机器学习算法中常见的损失函数，继而介绍GBDT算法。

1、损失函数

1.1、分类问题损失函数

在二分类中把

m = y \cdot f (x)

$m=y \cdot f(x)$ 称为margin。当

m<0 $m<0$ 时则说明误分类。基于此，下面介绍几种常见的分类损失函数。

1.1.1、 0-1损失

表达式为：

L 01 (m) = I (s i g n (f) \neq y)

$L_{01}(m)=I(sign(f) \neq y)$
或者

L 01 (m) = {0, m ⩾ 0 1, m < 0

$L_{01}(m)= \left\{ \begin{array}{l} 0, m\geqslant 0 \\1,m<0 \end{array} \right.$
即只对误分类样本进行惩罚，类似有后列几种损失。

1.1.2、指数损失

表达式：

L e = e x p (- y f)

$L_e = exp(-yf)$
Adaboost算法就是用的此种损失函数。在上一篇文章中有介绍。

1.1.3、 log损失

表达式：

L l = l o g (1 + e x p (- y f))

$L_l = log(1+exp(-yf))$
在逻辑回归中用到的损失函数。

1.1.4、均方损失

表达式：

L 2 = (y - f) 2

$L_2 = (y-f)^2$

1.1.5、hinge损失

表达式：

L h = (1 - y f) +

$L_h = (1-yf)_+$
在支持向量机中使用。

1.1.6、偏差损失函数

考虑K分类问题，假设在第k类的概率：

p k (x) = e x p ( f k ( x ) ) \sum K l = 1 e x p ( f l ( x ) )

$p_k(x)=\frac{exp(f_k(x))}{\sum_{l=1}^Kexp(f_l(x))}$
则多项式偏差：

L (y, p (x)) = - \sum k = 1 K I (y = g k) log p k (x) = - \sum k = 1 K I (y = g k) f k (x) + log (\sum k = 1

最低0.47元/天解锁文章

关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
损失函数与梯度提升树

上一篇文章简单介绍了几种集成方法，以随机森林为代表的平均方法，以adaboost、提升树为代表的提升方法。本文继续提升树的讨论，采用梯度提升算法，分析更一般的损失函数下的分类、回归问题。首先介绍几种在机器学习算法中常见的损失函数，继而介绍GBDT算法。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。