Boosted Trees简介【翻译+自己的理解】

肥宅_Sean

于 2019-02-03 13:33:48 发布

阅读量2.9k

点赞数

分类专栏：算法文章标签：算法 boosted Trees

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/a19990412/article/details/86758304

版权

算法专栏收录该内容

74 篇文章 1 订阅

订阅专栏

原文

https://homes.cs.washington.edu/~tqchen/pdf/BoostedTree.pdf
华盛顿大学的 Introduction to Boosted Trees. Tianqi Chen.

本文结合该论文和网上其他资料，在自己理解之后，书写下来~

文章目录

监督学习

Objective function(目标函数)：
训练损失：一般有两种
- 平方损失函数： $(y_i - \hat y_i)^2$
- 逻辑损失函数： $y_i\ln {(1+e^{-\hat y_i}) }+ (1-y_i) \ln{(1+e^{\hat y_i})}$
正则化损失：
- L1正则化（Lasso）： $\lambda||w||_1$
- L2正则化： $\lambda ||w||^2$

Regression Tree and Ensemble

Regression Tree 回归树（GART）

决策的原则类似于决策树
但是叶子节点上包含有分数

Regression Trees Ensemble 回归树集成

将多个回归树的结果求和，就是回归树集成
树集合的方法有很多种
例如：GBM(gradient boosting machine 梯度提升机器)、random forest 随机森林…
输入放缩固定，所以不需要在特征正则化上太小心。

假设我们使用K个树，那么有
$\hat y_i = \sum_{k}^{K}{f_i(xi)} \\ f_i \in F$

其中F是所有树的集合（其实是上面的图片所示的数学表达而已）
回归树不只能做回归，还可以做排序，分类… 主要取决于对应的目标函数。

Gradient boosting 梯度提升

这里不能直接使用SGD，因为寻找的f是树，而不是向量。所以使用 Additive Training (Boosting)
每次在原来的基础上，加上一个新的函数，构成第t轮下的数值。
那么推导到对应的目标函数，也就是找到对应的树，让这个整个数值最小。（训练损失也要小，模型损失也要小）

在这里插入图片描述

使用泰勒展开，g是一阶导，h是二阶导。偏移值是 $f_t(x)$
下图最后一行的例子，只是说明了在损失函数是平方函数时候的情况。

模型复杂度

之前曾考虑过，除了训练的复杂度之外，还需要考虑模型的损失。

下面是其中一种的定义：（再引入了两个超参数）
- T：叶子数量
- w: 回归树对应叶子节点的得分

结构得分

I：被选的树的集合
然后给出下面的关于G和H的定义
如果树的结构已经确定，那么对应的最优的权重也可以算出来。
下面会用到一种思维，假设所有的树一开始都是一棵树。之后，再根据对应的条件节点来做分割。
L表示的左树，R表示的是右树。

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

肥宅_Sean 公众号“肥宅Sean”欢迎关注

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。