树回归

本文详细介绍了CART(Classification and Regression Trees)算法在树回归中的应用,包括如何选择最佳特征和分界值,以及如何通过预剪枝和后剪枝防止过拟合。同时,文章提到了模型树的概念,它是CART的一种变体,通过在叶子节点使用线性回归方程提高预测准确性和可解释性。
摘要由CSDN通过智能技术生成
       当数据拥有众多的特征并且特征之间关系十分复杂的时候,构建全局模型的想法就显得太难了,也略显笨拙。而且,在实际生活中,许多的问题都是非线性的,不可能使用全局线性模型来拟合任何数据。

       一种可行的方法是将数据集划分成许多易建模的数据分片,然后利用线性回归技术在每个分片上建模。如果首次划分后的数据子集仍然很难拟合成线性模型,那么就继续划分。

       分类回归树(CART)就是采用这一原理工作的,该算法既可以用来分类也可以用来回归。之前我们讲过使用决策树来进行分类,那么分类回归树和决策树相比较有什么优势呢?

       决策树是一种贪心算法,通过不断将数据划分成小数据集,直到所有目标变量完全相同或者数据不能再划分为止。它要在给定时间内做出最佳选择,但并不关心能否达到全局最优。

       此外,决策树中使用的树构建算法是ID3。ID3划分过于迅速,并且不能直接处理连续型特征。二元划分法是另一种树构建方法,它每次把数据集划分为两份。ID3没有二元划分法好,因为二元划分法划分速度比ID3慢些且能够处理连续型特征。ID3和二元划分法还有一个重要的区别:ID3选取当前最佳的特征划分数据,每个特征作为划分的依据最多被使用一次;而二元划分法选取当前最佳的特征划分数据,某个特征可以多次被用于划分的依据。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值