cart决策树剪枝的个人理解

最新推荐文章于 2024-10-03 07:45:00 发布

wqtltm

最新推荐文章于 2024-10-03 07:45:00 发布

阅读量5.4k

点赞数 10

本文链接：https://blog.csdn.net/wqtltm/article/details/82597334

版权

本文介绍了CART决策树的剪枝过程，采用代价复杂度剪枝算法，通过调整参数α平衡预测误差与树复杂度。文章详细阐述了如何生成子树序列并进行交叉验证，以找到最优子树作为决策树。作者提出了自己的理解，强调剪枝过程中不仅选择最优超参数，而且是从小到大的α值进行剪枝，利用动态规划策略确定最佳剪枝方案。

摘要由CSDN通过智能技术生成

先说好前面部分我引用自以下这篇文章的，我不想写了

https://blog.csdn.net/wjc1182511338/article/details/76793164?locationNum=6&fps=1

CART之剪枝详解

我们这里用的是代价复杂度剪枝算法。

首先我们将一颗充分生长的树称为T0 ，我们希望减少树的大小来防止过拟化，但又担心去掉一些节点后预测的误差会增大，那么如何达到这两个变量之间的平衡则是问题的关键，因此我们用一个变量α来平衡，因此损失函数定义为如下：

T为任意子树，C(T)为预测误差，可以是平方误差也可以是基尼指数，|T|为子树T的叶子节点个数，注意是叶子节点，α 是参数，C(T)衡量训练数据的拟合程度，|T|衡量树的复杂度（即大小），α 权衡拟合程度与树的复杂度。

那么我们如何找到这个合适的α来使拟合程度与复杂度之间达到最好的平衡呢，最好的办法就是，我们将α从0取到正无穷，对于每一个固定的α，我们都可以找到使得Cα(T)最小的最优子树T(α) 。当α 很小的时候，T0是这样的最优子树，当α很大的时候，单独一个根节点是这样的最优的子树。

尽管α 取值无限多，但是T0 的子树是有限个，因此我们可以生成这样一个子树序列

Tn是最后剩下的那个根节点。（这里的子树生成是根据前一个子树Ti，剪掉某一个内部节点，生成Ti+1）然后对这样的子树序列分别用测试集进行交叉验证，找到最优的那个子树作为我们的决策树。

这也是代价复杂度剪枝的核心思想。

基于上面的论述，剪枝可分为两部分，第一部分生成子树序列，第二部分交叉验证。

1. 生成子树序列

我们每次剪枝剪的都是某个内部节点的子节点，也就是将某个内部节点的所有子节点回退到这个内部节点里，并将这个内部节点作为叶子节点。因此在计算整体的损失函数时，这个内部节点以外的值都没变，只有这个内部节点的局部损失函数改变了，因此我们本需要计算全局的损失函数，但现在只需要计算内部节点剪枝前和剪枝后的损失函数。

对任意内部节点t，

剪枝前的状态：有|Tt| 个叶子节点，预测误差是C(Tt)

剪枝后的状态：只有本身一个叶子节点，预测误差是C(t)