决策树剪枝算法

本文介绍了决策树剪枝算法,旨在防止过拟合,通过损失函数和经验熵评估模型性能。剪枝分为预剪枝和后剪枝,后剪枝在树生成后进行。算法步骤包括计算结点熵,自底向上回缩,依据损失函数判断是否剪枝,以获得最佳简化树。
摘要由CSDN通过智能技术生成

算法目的:决策树的剪枝是为了简化决策树模型,避免过拟合。

算法基本思路:减去决策树模型中的一些子树或者叶结点,并将其根结点作为新的叶结点,从而实现模型的简化。

模型损失函数
1. 变量预定义:|T|表示树T的叶节点个数,t表示树T的叶节点,同时, Nt 表示该叶节点的样本点个数,其中属于k类的样本点有 Ntk 个,K表示类别的个数, Ht(T) 为叶结点t上的经验熵, α0 为参数
2. 损失函数: Ca(T)=t=1

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值