决策树的剪枝

最新推荐文章于 2024-01-29 19:00:00 发布

hustqb

最新推荐文章于 2024-01-29 19:00:00 发布

阅读量738

点赞数 1

分类专栏：机器学习

机器学习专栏收录该内容

21 篇文章 19 订阅

订阅专栏

摘自《机器学习导论》

剪枝

通常，如果到达一个节点的训练实例数小于训练集的某个百分比（例如，5%），则无论是不纯（离散数据）还是误差（连续数据），该节点都不进一步划分。其基本思想是，基于过少实例的决策树会导致较大的方差，从而导致加大的泛化误差。在树完全构造出来之前就提前停止树构造称作树的先剪枝(prepruning)。

得到较小树的另一种可能做法是后剪枝(postpruning)，在实践中它比先剪枝效果更好。鉴于树的生长是贪心的，在每一步我们做出一个决策（即产生一个决策节点）以继续进行，绝不会说尝试其他可能的选择。唯一例外是后剪枝，它试图找出并剪出不必要的子树。

在后剪枝中，我们让树完全增长直到所有的树叶都是纯的且训练误差为0。然后我们找出导致过拟合的子树并剪除它们。我们从最初的被标记的数据集中保留一个剪枝集，在训练阶段不使用它。对每棵子树，我们用一个被该子树覆盖的训练实例标记的树叶节点替换它。如果该树叶在剪枝集上的性能不比该子树差，则剪掉该子树病保留树叶节点，因为该子树的附加复杂性是不必要的；否则保留子树。

先剪枝速度快，后剪枝准确率高。

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
决策树的剪枝

摘自《机器学习导论》剪枝通常，如果到达一个节点的训练实例数小于训练集的某个百分比（例如，5%），则无论是不纯（离散数据）还是误差（连续数据），该节点都不进一步划分。其基本思想是，给予郭少实例的决策树导致较大的方差，从而导致加大的泛化误差。在树完全构造出来之前就提前停止树构造称作树的先剪枝(prepruning)。得到较小树的另一种可能做法是后剪枝(postpruning)，在实践中
复制链接

扫一扫

专栏目录

hustqb CSDN认证博客专家 CSDN认证企业博客

码龄8年

58: 原创

23万+: 周排名

58万+: 总排名

187万+: 访问

: 等级

8003: 积分

632: 粉丝

1251: 获赞

269: 评论

3958: 收藏

私信

关注

热门文章

分类专栏

最新评论

TensorFlow保存和恢复变量——tf.train.Saver()
lizepengg: 谢谢你，今天又学到了知识
超全面的协方差矩阵介绍
230万光年的思念: 两个随机变量X和Y之间的协方差矩阵是对称矩阵吗？
数据降维与可视化——t-SNE
歪西_Yang: 请问标准化与t-SNE可视化的顺序是否有数学解释，因为我看到不少帖子会把标准化放在t-SNE的结果上。
图文并茂的PCA教程
Faner0: 博主，第二个解释方法求Var(z1)那里怎么化简的呢，我们老师是z1和它的转置相乘
数据降维与可视化——t-SNE
一只哈基米: 可视化后数据呈现出曲线分布是什么情况啊，数据可分，但是结果基本没用

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。