4.3.1有监督学习（三） - 决策树（Decision Tree） - 剪枝（Pruning）

最新推荐文章于 2024-04-25 11:35:06 发布

进击的橘子猫

最新推荐文章于 2024-04-25 11:35:06 发布

阅读量4k

点赞数 2

分类专栏：数据分析与挖掘框架 Python模型 R模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Orange_Spotty_Cat/article/details/81628037

版权

本文介绍了决策树的剪枝方法，包括预剪枝和后剪枝，旨在防止过拟合。剪枝通过留出法在测试集上评估，保留模型的泛化能力。预剪枝在树生成过程中停止划分，而后剪枝在树生成后从叶结点向上检查。通过实例展示了剪枝过程和效果，强调了样本量和合理划分的重要性。

摘要由CSDN通过智能技术生成

简介

决策树是与有监督学习中的常用方法。决策树的算法多见于分类问题中，即我们常说的分类树（Classification Tree）；少数情况下，决策树也可以用于连续问题，即回归树（Regression Tree）。若构建决策树的自变量过多，会产生高维度、过拟合等问题，因此，需要在全树的基础上进行剪枝，保留最有效的自变量，删除不那么重要的自变量。这一过程，就叫剪枝。

一句话解释版本：

剪枝分为前剪枝与后剪枝，通过留出法在测试集上比对剪枝前后的效果来判定是否剪枝。

数据分析与挖掘体系位置

决策树是有监督学习中的一种模型。所以在数据分析与数据挖掘中的位置如下图所示。

剪枝的目的

对决策树进行剪枝的目的是为了防止过拟合（Overfitting）问题。

过拟合就是值学习器把样本学的太好了，把一些只属于训练集的特性也当作了一般性规律处理。在决策树中，过多的分支会使模型将一些个性化特征视为一般性特征，降低了泛化能力。因此就需要我们通过剪枝减少分支（自变量）个数。

剪枝的方法

剪枝的方法分为：预剪枝（pre-pruning）与后剪枝（post-pruning）。<

最低0.47元/天解锁文章

进击的橘子猫

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
4.3.1有监督学习（三） - 决策树（Decision Tree） - 剪枝（Pruning）

简介决策树是与有监督学习中的常用方法。决策树的算法多见于分类问题中，即我们常说的分类树（Classification Tree）；少数情况下，决策树也可以用于连续问题，即回归树（Regression Tree）。若构建决策树的自变量过多，会产生高维度、过拟合等问题，因此，需要在全树的基础上进行剪枝，保留最有效的自变量，删除不那么重要的自变量。这一过程，就叫剪枝。一句话解释版本：剪枝分为...
复制链接

扫一扫

专栏目录

进击的橘子猫 CSDN认证博客专家 CSDN认证企业博客

码龄6年

47: 原创

6万+: 周排名

157万+: 总排名

77万+: 访问

: 等级

3478: 积分

719: 粉丝

588: 获赞

85: 评论

2870: 收藏

私信

关注

热门文章

分类专栏

最新评论

3.4.2数据标准化（一） - Z-Score标准化
Flynn1392: CSDN是越来越封闭了
4.4.2分类模型评判指标（一） - 混淆矩阵(Confusion Matrix)
这都啥跟啥: 或者说，文章里出现的混淆矩阵默认一个前提：以猫为例(猪狗同理)，真猫都会被检测为猫猪狗中的一种，并且检测到的假猫只来自猪或者狗。这里忽略了背景问题：一是真猫没有被识别为猫猪狗，而当作背景漏检了；二是背景区域(非猫猪狗)也可能被检测为猫。所以想问一下：当背景作为一个类，而未被标注时，应该怎样计算ACC？
4.4.2分类模型评判指标（一） - 混淆矩阵(Confusion Matrix)
这都啥跟啥: 请问ACC的定义“分类模型所有判断正确的结果占总观测值的比重”中“观测值”的定义是什么？比如图片中目标检测场景：狗数真实值为10，模型认为有5只狗、2只猫、剩余3只认为不属于已知类别（相当于认为是背景），那这3只计入观测值吗？同理，牛数真实值为10，模型认为有12头牛，其中包含10头牛和2个背景（背景被误检测为牛），那这2个背景计入观测值吗？
4.4.2分类模型评判指标（一） - 混淆矩阵(Confusion Matrix)
Mr·小鱼: 博主说错了，我查了一下。第一类错误，把真当假，也就是FN。第二类错误，把假当真，也就是FP。
3.4数据预处理（四） - 数据转换（Data Transform）
撒野448: 大佬你好，聚类的链接点进去是空的，请问文章还在吗？很想知道怎么聚类！谢谢~

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。