Boosted Trees简介【翻译+自己的理解】

原文

https://homes.cs.washington.edu/~tqchen/pdf/BoostedTree.pdf
华盛顿大学的 Introduction to Boosted Trees. Tianqi Chen.

本文结合该论文和网上其他资料,在自己理解之后,书写下来~

监督学习

  • Objective function(目标函数):
    在这里插入图片描述

  • 训练损失:一般有两种

    • 平方损失函数: ( y i − y ^ i ) 2 (y_i - \hat y_i)^2 (yiy^i)2
    • 逻辑损失函数: y i ln ⁡ ( 1 + e − y ^ i ) + ( 1 − y i ) ln ⁡ ( 1 + e y ^ i ) y_i\ln {(1+e^{-\hat y_i}) }+ (1-y_i) \ln{(1+e^{\hat y_i})} yiln(1+ey^i)+(1yi)ln(1+ey^i)
  • 正则化损失:

    • L1正则化(Lasso): λ ∣ ∣ w ∣ ∣ 1 \lambda||w||_1 λw1
    • L2正则化: λ ∣ ∣ w ∣ ∣ 2 \lambda ||w||^2 λw2

Regression Tree and Ensemble

Regression Tree 回归树(GART)

  • 决策的原则类似于决策树
  • 但是叶子节点上包含有分数
    在这里插入图片描述

Regression Trees Ensemble 回归树集成

  • 将多个回归树的结果求和,就是回归树集成
    在这里插入图片描述

  • 树集合的方法有很多种
    例如:GBM(gradient boosting machine 梯度提升机器)random forest 随机森林

  • 输入放缩固定,所以不需要在特征正则化上太小心。

假设我们使用K个树,那么有
y ^ i = ∑ k K f i ( x i ) f i ∈ F \hat y_i = \sum_{k}^{K}{f_i(xi)} \\ f_i \in F y^i=kKfi(xi)fiF

  • 其中F是所有树的集合(其实是上面的图片所示的数学表达而已

  • 回归树不只能做回归,还可以做排序,分类… 主要取决于对应的目标函数。

Gradient boosting 梯度提升

  • 这里不能直接使用SGD,因为寻找的f是树,而不是向量。所以使用 Additive Training (Boosting)

  • 每次在原来的基础上,加上一个新的函数,构成第t轮下的数值。
    在这里插入图片描述

  • 那么推导到对应的目标函数,也就是找到对应的树,让这个整个数值最小。(训练损失也要小,模型损失也要小)

在这里插入图片描述

  • 使用泰勒展开,g是一阶导,h是二阶导。偏移值是 f t ( x ) f_t(x) ft(x)
    下图最后一行的例子,只是说明了在损失函数是平方函数时候的情况。
    在这里插入图片描述

模型复杂度

之前曾考虑过,除了训练的复杂度之外,还需要考虑模型的损失。

  • 下面是其中一种的定义:(再引入了两个超参数)
    • T:叶子数量
    • w: 回归树对应叶子节点的得分
      在这里插入图片描述

结构得分

  • I:被选的树的集合

  • 然后给出下面的关于G和H的定义

  • 如果树的结构已经确定,那么对应的最优的权重也可以算出来。
    在这里插入图片描述

  • 下面会用到一种思维,假设所有的树一开始都是一棵树。之后,再根据对应的条件节点来做分割。

  • L表示的左树,R表示的是右树。
    在这里插入图片描述

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

肥宅_Sean

公众号“肥宅Sean”欢迎关注

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值