机器学习手记[13]--CART树回归算法解析

本文介绍了CART树回归算法,对比了它与ID3决策树的区别,CART树适用于处理连续值。文章通过数据文本展示了CART树的构建过程,强调了在连续值上的总方差作为纯净度指标,并探讨了剪枝过程,包括预剪枝和后剪枝,以及回归树和模型树的概念。
摘要由CSDN通过智能技术生成

CART树回归算法解析

1 初衷

  1. 我们之前接触的ID3决策树,它特点是将所有的特征转化成标称的值。比如说年龄维度的数据是从1-80的,我们不是将这个特征按照80分进行特征分支而跟可能是按照老中青这种分成几个区间的特征,这个过程也就是将连续值转化成标称值。也就是说ID3决策树处理其实还是离散值,不是连续值。而且怎么处理都是人说了算的,年龄可以那样分,但是其它的数据是不是也是同样分呢?在这个转换过程中,我们是不是流失掉了一些信息,而且如果所有的连续值都化成离散值的话,是不是也不科学呢?
  2. 今天学的这个CART树,则是比较适合连续值的处理。他实际是个二叉树,反复将连续输入的特征值进行二分。

2 数据文本

输入文本格式
输入样本 分类结果
0.409175 1.883180
0.182603 0.063908
0.663687 3.042257
0.517395 2.305004
0.013643 -0.067698
0.469643 1.662809
0.725423 3.275749

3 CART树

  1. CART树和ID3决策树回归是一样的,不同的地方是CART树做的都是二分,而ID3则可以一个节点分出多个分支。

  2. 纯净度依据:经典的CART

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值