决策树和opencv实现，随机森林，随机蕨

最新推荐文章于 2023-08-23 10:40:44 发布

learnee

最新推荐文章于 2023-08-23 10:40:44 发布

阅读量2.8k

点赞数 3

分类专栏：实践文章标签：统计学实例

本文链接：https://blog.csdn.net/learnee/article/details/49915809

版权

本文介绍了决策树的起源、特点及在统计学中的应用，包括其作为随机森林、Boosting和Bagging的基础。文章讨论了熵、信息增益等概念，并通过实例展示了如何构建决策树。此外，还提到了决策树过拟合问题及剪枝算法，最后预告将探讨C4.5、随机森林等相关主题。

摘要由CSDN通过智能技术生成

决策树是怎么来的呢?Morgan and Sonquist ,提出的基于树的方法，叫做：automatic interaction detector AID ,（为了解决资料数据上下文的多变量非加性效应？）算了还是给原句吧，AID for handling multi-variate non-additive effects in the context of survey data。
决策树的几个特点：
1.处理异质数据。
2.对噪声数据鲁棒。
3.对离群点鲁棒。
4.是容易解释的，即使是对非统计专业的用户。
决策树是随机森林、boosting、bagging等的基础。
以下论点或摘自统计学习方法(李航)，或自己理解。决策树是一种描述对实例进行分类的树形结构，决策树由结点(node)和有向边(direct edge)组成，结点有两种类型：内部节点(internal node)和叶节点(leaf node)。内部节点表示一个特征或属性，叶节点表示一个类别。
图示的话就摘一下大家通用的吧
这里写图片描述
可以看作在超平面的划分如下：

图片是这位仁兄的，谢谢你啦http://database.51cto.com/art/201407/444788.htm
这里还要重点介绍一下熵和信息增益、信息增益率的信息：