决策树

最新推荐文章于 2024-04-24 09:23:18 发布

急着吃饭的李先生

最新推荐文章于 2024-04-24 09:23:18 发布

阅读量318

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43117447/article/details/102578426

版权

在所有的机器学习模型中，决策树是最贴近咱们生活的！

从数据中学习决策树，需要学习三样东西：

树的形状
每一个决策的阈值θ
叶节点的值

一棵决策树也具有大量的参数，但树本身是具有结构的。结构的学习也叫作Structured Prediction，因为这种问题不像之前讨论的比如回归问题只需要预测一个值就可以了，而是同时也要学出一种具体的结构。

结构的学习一般来说都很难，很多都是NP-hard问题。简单来讲NP-hard问题就是那些多项式时间复杂度内基本上解不出来的问题，一般需要指数级复杂度。

一般对于这类的问题是没有一个很好的方式来求出全局最优解的。既然这样，我们通常会使用近似算法来找到“相对”最好的解。一个经典的近似算法叫作“贪心算法”。这类的算法每次只考虑局部最好的情况，所以一般带来的是相对最好的解决方案。但在某些特定的情况下，也可以给出全局最优解。

给定数据并学出最好的决策树本身也是很难的问题。在这个问题上，我们也通常使用贪心算法来做每一步的决策，比如使用信息增益来判断下一个节点上需要放哪一个特征。

不确定性的减少也叫作信息增益(information gain)。构建决策树的过程无非是每一步通过信息增益来选择最好的特征作为当前的根节点，以此类推，持续把树构造起来。

决策树的构建过程：
每一步的构建其实就是选择当前最好的特征作为根节点。然后持续地重复以上过程把整棵树构建起来。其中，信息增益充当着每次选择特征的标准。

当然，除了信息增益，我们也可以选择其他的指标作为选择特征的标准。

到此为止，决策树的构建过程已经说完了。除了这些其实还有几个重要问题需要考虑，比如如何让决策树避免过拟合、如何处理连续型特征、如何使用决策树来解决回归问题等。

最低0.47元/天解锁文章

急着吃饭的李先生

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
决策树

在所有的机器学习模型中，决策树是最贴近咱们生活的！从数据中学习决策树，需要学习三样东西：树的形状每一个决策的阈值θ叶节点的值一棵决策树也具有大量的参数，但树本身是具有结构的。结构的学习也叫作Structured Prediction，因为这种问题不像之前讨论的比如回归问题只需要预测一个值就可以了，而是同时也要学出一种具体的结构。结构的学习一般来说都很难，很多都是NP-hard问题。...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。