理论-决策树小补充

最新推荐文章于 2024-04-23 20:17:02 发布

小白自留地

最新推荐文章于 2024-04-23 20:17:02 发布

阅读量79

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43165880/article/details/109354564

版权

机器学习专栏收录该内容

33 篇文章 25 订阅

订阅专栏

之前的决策树只简单介绍了决策树思想，决策树还有多种类型，做一个白话的小总结，待补充完善。

ID3算法使用信息增益选择属性，C4.5用信息增益率，克服信息增益容易选择取之类别偏多的特征的不足！！

ID3，C4.5都只用于分类问题；

CART（Classification And Regression Tree）即可用于分类，也可用于回归，sklearn中使用的是CART算法，可以做分类（DecisionTreeClassifier），也可以做回归（DesicionTreeRegression）.
CART是二叉树.
作为分类树时，特征可以连续（需要转化为离散数据）/离散，但标签数据为离散，节点分裂时使用Gini系数（Gini系数同熵值原理相似，越大表示数据不确定性越大，越小表示不确定性越小，样本属于同一类的概率越大）.
作为回归树时，特征通常也是连续属性，标签数据为连续.

GBDT（Gradient Boosting Decision Tree），多棵决策树累加值作为最终结果。GBDT中的树都是回归树，不是分类树。是Boosting算法，但注意和AdaBoost区分。
GDBT一般适用于回归问题（线性/非线性）.也可以用于二分类，但输出结果不是直接的类别，可以设定阈值，大于阈值为1类，小于阈值为0类。

XGBoost是对GBDT进行了完善，思想类似，中间的计算过程进行了改进，使得计算效率更高，模型性能更好！

小白自留地

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
理论-决策树小补充

之前的决策树只简单介绍了决策树思想，决策树还有多种类型，做一个小总结，待补充完善。ID3算法使用信息增益选择属性，C4.5用信息增益率，克服信息增益容易选择取之类别偏多的特征的不足！！ID3，C4.5都只用于分类问题；CART（Classification And Regression Tree）即可用于分类，也可用于回归，sklearn中使用的是CART算法，可以做分类（DecisionTreeClassifier），也可以做回归（DesicionTreeRegression）.CART是二叉树.
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。