决策树、GDBT、Xgboost、LightGBM

最新推荐文章于 2020-11-15 15:25:44 发布

向阳争渡

最新推荐文章于 2020-11-15 15:25:44 发布

阅读量278

点赞数

分类专栏：机器学习文章标签：集成学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yangyang_yangqi/article/details/88429039

版权

机器学习专栏收录该内容

10 篇文章 0 订阅

订阅专栏

决策树

决策树的学习通常包含3个步骤：特征选择、决策树的生成、决策树的修剪

决策树算法通常是递归地选择最优特征，并根据该特征对训练数据进行分割。

特征选择

选取对训练数据具有分类能力的特征。通常的准则是信息增益或者信息增益比。信息增益越大，表示该特征不确定性越强，越适合作为特征进行特征分类。

决策树的裁剪

决策树生成算法递归地选取最优特征产生决策树，知道不能继续下去为止。但是这样容易产生过拟合。

在决策树学习中将已生成的树进行简化的过程称为剪枝。

决策树的剪枝通常使用极小化决策树整体的损失函数或代价函数来实现。

分类回归树CART

CART算法由以下两步组成：

决策树生成：基于训练数据生成决策树，生成的决策树要尽量大
决策树剪枝：用验证集对生成树进行剪枝并选择最优子树

采用加法模型与前向分布算法，以决策树为基函数的提升方法称为提升树

加法模型的思想是：每次学习一点，然后一点点的接近最终的预测值(深度学习里梯度的概念)

GBDT

对于一般的损失函数，一步步的优化是不容易的，这是需要梯度提升算法。这是利用最速下降法，关键是利用损失函数的负梯度方向在当前模型的值作为回归提升树的残差近似值去拟合一个回归树。

GBDT与xgboost对比

传统GBDT以CART作为基分类器，xgboost还支持线性分类器
GDBT优化时只用到了一阶导数信息，xgboost则对代价函数进行了二阶泰勒展开，同时用到了一阶和二阶

lightGBM和xgboost

xgboost采用的是level-wise的分裂策略，而lightGBM采用了leaf-wise的策略

lightGBM在featureparallel和data parallel等方面做了并行

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
决策树、GDBT、Xgboost、LightGBM

决策树决策树的学习通常包含3个步骤：特征选择、决策树的生成、决策树的修剪决策树算法通常是递归地选择最优特征，并根据该特征对训练数据进行分割。特征选择选取对训练数据具有分类能力的特征。通常的准则是信息增益或者信息增益比。信息增益越大，表示该特征不确定性越强，越适合作为特征进行特征分类。决策树的裁剪决策树生成算法递归地选取最优特征产生决策树，知道不能继续下去为止。但是这样容易产...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。