决策树、CART、随机森林、GBDT和XGBoost

最新推荐文章于 2023-05-12 21:44:21 发布

Oliver8459

最新推荐文章于 2023-05-12 21:44:21 发布

阅读量500

点赞数

分类专栏： ML/DL算法文章标签：机器学习决策树 cart分类回归树

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42129882/article/details/108641258

版权

决策树

1.分类依据

计算每个属性进行划分的信息增益(率)，选择最高的进行划分。
信息熵：越小表示该属性下的数据集纯度越高，越适合进行划分。

在这里插入图片描述
信息增益：

信息增益率

2.剪枝

防止过拟合
预剪枝：在划分时，用验证集分别计算划分与不划分的精度进行比较来决定是否继续分裂。
后剪枝：决策树构建完毕后，用验证集自底向上对非叶子节点进行剪枝判断，若剪枝与不剪枝的精度相同，还是选择剪枝。

3.连续值

若属性为连续值，而非枚举型的值，将该属性所有的值进行排序，然后用二分法进行划分

4.缺失值

信息增益用它来表示
在这里插入图片描述
第一项表示无缺失样例/总样例
第二项表示所有无缺失样例的信息增益

5.多变量决策树

每次仅用单个属性

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
决策树、CART、随机森林、GBDT和XGBoost

q
复制链接

扫一扫

专栏目录

Oliver8459 CSDN认证博客专家 CSDN认证企业博客

码龄6年

11: 原创

75万+: 周排名

134万+: 总排名

2万+: 访问

: 等级

291: 积分

6: 粉丝

9: 获赞

6: 评论

77: 收藏

私信

关注

热门文章

分类专栏

面试 3篇
ML/DL算法 3篇
语言 1篇
安装配置 3篇
论文笔记 1篇

最新评论

人脸识别或多分类问题的性能评判指标——ROC曲线绘制
Alanana: 有代码吗
滴滴算法岗实习面经
Phoenix 莫轻言: 请问多长时间给你发的offer啊？
深度学习笔记[更新中。。。]
无敌右脑: 博主，你有AdaBN的代码吗？
一篇文章让你完全理解置信区间与置信度
Lina Bell: 我有点不清楚，从65%的那个分布图可以得到小于等于63%的概率是25%，之后的那一次确定了63%的95%置信区间是60-66，这一次是重新做了一次实验还是直接从上面用的结果呢
一篇文章让你完全理解置信区间与置信度
wenQq1: [code=python] import numpy as np love_soccer_prop = 0.65 # Real percentage of people who love soccer total_population = 325*10**6 # Total population in the U.S. (325M) num_people_love_soccer = int(total_population * love_soccer_prop) num_people_dont_love_soccer = int(total_population * (1 - love_soccer_prop)) people_love_soccer = np.ones(num_people_love_soccer) people_dont_love_soccer = np.zeros(num_people_dont_love_soccer) all_people = np.hstack([people_love_soccer, people_dont_love_soccer]) print (np.mean(all_people)) [/code]

大家在看

python高效文件下载：设计一个支持多线程的并发下载器 155

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。