剪枝处理-----决策树

决策树剪枝是防止过拟合的重要方法,包括预剪枝和后剪枝。预剪枝在划分前评估,若不能提升泛化性能则停止划分,降低过拟合风险但可能导致欠拟合。后剪枝则生成完整决策树后再自底向上裁剪,保留更多分支,泛化能力通常优于预剪枝,但训练时间更长。
摘要由CSDN通过智能技术生成

剪枝处理

在之前的内容中提到过,决策树建立的时候停止的三个理论条件,理论上,在给定的样本集和中,一般要等到属性划分完或者样本分类完成再停止,但是这样很容易导致决策树的过拟合。剪枝是决策树对付“过拟合”的主要手段,剪枝顾名思义就是修剪决策树,减少宽度和深度,使得树不那么复杂,可以有效防止“过拟合”。

决策树剪枝的基本策略有“预剪枝”和“后剪枝”。

1. 预剪枝

预剪枝是指在决策树生成的过程中,对每个结点在划分前先进行估计,如果当前结点的划分不能带来决策树泛化性能的提升,那么停止划分并且将当前结点标记为叶子结点。

如上图所示,在对第二层划分之前,我们先将样本集合输入决策树中,计算精度,比较划分前后的精度,再决定这个结点是分支结点还是叶子结点。很明显,预剪枝使得决策树的很多分支都没有“展开”,这样不仅降低了过拟合的风险,也减少了决策树的训练时间开销和预测时间开销。但是另一方面,有些分支的当前划分虽然不能提升泛化性能,但是在其基础上进行的后续划分可能会导致性能显著提高。并且"预剪枝"使得决策树中的多个分支不得已展开,会带来欠拟合的风险。

2. 后剪枝

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值