决策树预测算法以及模型的联结

最新推荐文章于 2023-08-05 01:49:09 发布

小太皮

最新推荐文章于 2023-08-05 01:49:09 发布

阅读量2.9k

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_20550227/article/details/81917052

版权

机器学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

决策树预测算法以及模型的联结

针对分类问题，叶子节点给出的数据属于每个类别的概率，而这个概率值等于各个类别的数据占比。假设数据分为K类，分别记为0，1，…，K-1，叶子节点上一共有N个数据，则P(y=i)=Σj1{yj=i}/N。基于预测得到的概率，就可以很直接地得到最终的预测结果为出现概率最大的类别。
针对回归问题，叶子节点的处理方式类似，最终的预测结果等于节点内标签变量{yi}的平均值。

模型的联结

仔细分析决策树可以得到，这个模型的优点在于能综合考虑多个变量，对变量的线性转换是稳定的。另外，它对连续性变量的处理方法是将其划分成几个互不相交的区间，这样的处理方法能有效地规避定量变量边际效应恒定的隐含假设。但模型的最后一步算法比较薄弱，只是简单地求类别占比或者平均值。这实际导致单独使用决策树搭建模型时，预测效果并不理想（实际建模时，很少单独使用决策树模型）。

实际应用中，为了得到更好的预测效果，需要借助模型联结主义：将决策树作为整体模型的一部分和其他模型嵌套使用。

如下图所示，将决策树视为一种特征提取的模型，首先使用它对某些原始特征（一般为数值型特征）做聚类运算，将数据位于决策树的哪个叶子节点作为新特征。比如假设决策树有4个节点，依次命名为1，2，3，4；某个数据落在第3个叶子节点，则用向量（0，1，0，0）来表示这个数据。如何利用这些新特征和剩下的原始特征搭建逻辑回归模型，由此得到最终的预测结果。

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
决策树预测算法以及模型的联结

决策树预测算法以及模型的联结针对分类问题，叶子节点给出的数据属于每个类别的概率，而这个概率值等于各个类别的数据占比。假设数据分为K类，分别记为0，1，…，K-1，叶子节点上一共有N个数据，则P(y=i)=Σj1{yj=i}/N。基于预测得到的概率，就可以很直接地得到最终的预测结果为出现概率最大的类别。针对回归问题，叶子节点的处理方式类似，最终的预测结果等于节点内标签变量{yi}的平均值。...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。