机器学习手记[13]--CART树回归算法解析

最新推荐文章于 2024-01-05 17:33:14 发布

虾米ning

最新推荐文章于 2024-01-05 17:33:14 发布

阅读量328

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/a_31415926/article/details/43514811

版权

本文介绍了CART树回归算法，对比了它与ID3决策树的区别，CART树适用于处理连续值。文章通过数据文本展示了CART树的构建过程，强调了在连续值上的总方差作为纯净度指标，并探讨了剪枝过程，包括预剪枝和后剪枝，以及回归树和模型树的概念。

摘要由CSDN通过智能技术生成

CART树回归算法解析

1 初衷

我们之前接触的ID3决策树，它特点是将所有的特征转化成标称的值。比如说年龄维度的数据是从1-80的，我们不是将这个特征按照80分进行特征分支而跟可能是按照老中青这种分成几个区间的特征，这个过程也就是将连续值转化成标称值。也就是说ID3决策树处理其实还是离散值，不是连续值。而且怎么处理都是人说了算的，年龄可以那样分，但是其它的数据是不是也是同样分呢？在这个转换过程中，我们是不是流失掉了一些信息，而且如果所有的连续值都化成离散值的话，是不是也不科学呢？
今天学的这个CART树，则是比较适合连续值的处理。他实际是个二叉树，反复将连续输入的特征值进行二分。

2 数据文本

输入文本格式
输入样本分类结果
0.409175 1.883180
0.182603 0.063908
0.663687 3.042257
0.517395 2.305004
0.013643 -0.067698
0.469643 1.662809
0.725423 3.275749

3 CART树

CART树和ID3决策树回归是一样的，不同的地方是CART树做的都是二分，而ID3则可以一个节点分出多个分支。
纯净度依据：经典的CART

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。