机器学习算法实践——决策树

最新推荐文章于 2024-05-07 17:32:29 发布

新小小小野

最新推荐文章于 2024-05-07 17:32:29 发布

阅读量302

点赞数

分类专栏：机器学习文章标签：决策树机器学习

本文链接：https://blog.csdn.net/qq_36831845/article/details/108182092

版权

机器学习算法实践——决策树

决策树的介绍和应用

决策树的介绍

决策树是一种常见的分类模型，在金融分控、医疗辅助诊断等诸多行业具有较为广泛的应用。决策树的核心思想
是基于树结构对数据进行划分，这种思想是人类处理问题时的本能方法。例如在婚恋市场中，女方通常会先看男
方是否有房产，如果有房产再看是否有车产，如果有车产再看是否有稳定工作……最后得出是否要深入了解的判
断。在这里插入图片描述
决策树的主要优点：

具有很好的解释性，模型可以生成可以理解的规则。
可以发现特征的重要程度。
模型的计算复杂度较低。

决策树的主要缺点：

模型容易过拟合，需要采用减枝技术处理。
不能很好利用连续型特征。
预测能力有限，无法达到其他强监督模型效果。
方差较高，数据分布的轻微改变很容易造成树结构完全不同。

决策树构建

输入：训练集 $D={(x_1 ,y_1 ),(x_2 ,y_2 ),....,(x_m ,y_m )};$
特征集 $A=\{ a_1,a_2 ,....,a_d \}$

输出：以node为根节点的一颗决策树

过程：函数TreeGenerate $(D, A)$

生成节点node
$i f$ $D 中样本全书属于同一类别 :$
----将node标记为类叶节点；
$i f A = 空集 o r D 中样本在上的取值相同 :$
----将node标记为叶节点，其类别标记为中样本数最多的类； $r e t u r n$
从 $A中选择最优划分属性 a_*;$
$for a_*的每一个值a_*^v :do$
----为node生成一个分支， $令 D_v表示 a_*中在上取值为的样本子集；$

最低0.47元/天解锁文章

新小小小野

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
机器学习算法实践——决策树

机器学习算法实践——决策树决策树的介绍和应用决策树的介绍决策树是一种常见的分类模型，在金融分控、医疗辅助诊断等诸多行业具有较为广泛的应用。决策树的核心思想是基于树结构对数据进行划分，这种思想是人类处理问题时的本能方法。例如在婚恋市场中，女方通常会先看男方是否有房产，如果有房产再看是否有车产，如果有车产再看是否有稳定工作……最后得出是否要深入了解的判断。决策树的主要优点：具有很好的解释性，模型可以生成可以理解的规则。可以发现特征的重要程度。模型的计算复杂度较低。决策树的主要缺点：
复制链接

扫一扫