GBM算法

最新推荐文章于 2024-04-28 14:33:16 发布

Florence_Janie

最新推荐文章于 2024-04-28 14:33:16 发布

阅读量7.8k

点赞数 1

分类专栏：人工智能 Python

本文链接：https://blog.csdn.net/qq_34690929/article/details/79729866

版权

42 篇文章 4 订阅

订阅专栏

23 篇文章 0 订阅

订阅专栏

boosting如何工作

Boosting可以将一系列弱学习因子（weak learners）相结合来提升总体模型的预测准确度。在任意时间t，根据t-1时刻得到的结果我们给当前结果赋予一个权重。之前正确预测的结果获得较小权重，错误分类的结果得到较大权重。回归问题的处理方法也是相似的。

总的来说GBM的参数可以被归为三类：

1. 初始分类目标的参数值
2. 对所有的分类树进行迭代：
    2.1 根据前一轮分类树的结果更新分类目标的权重值（被错误分类的有更高的权重）
    2.2 用训练的子样本建模
    2.3 用所得模型对所有的样本进行预测
    2.4 再次根据分类结果更新权重值
3. 返回最终结果

之前说过，我们要调节的参数有两种：树参数和boosting参数。learning rate没有什么特别的调节方法，因为只要我们训练的树足够多learning rate总是小值来得好。

虽然随着决定树的增多GBM并不会明显得过度拟合，高learing rate还是会导致这个问题，但如果我们一味地减小learning rate、增多树,计算就会非常昂贵而且需要运行很长时间。

关注