决策树：从特征的重要程度说起

最新推荐文章于 2024-01-09 14:08:46 发布

on2way

最新推荐文章于 2024-01-09 14:08:46 发布

阅读量1.1w

点赞数 12

分类专栏：模式识别&amp;机器学习模式识别&机器学习文章标签：决策树

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/on2way/article/details/85226024

版权

开始陆续介绍决策树与随机森林，理解原理与会用来做分类算法是其一，更重要的是要理解决策树构造的精髓并加以推广应用才是算融会贯通。

先来看看所谓的树结构，其实很简单，就是从一个节点往下依次不断分裂节点的一种结构，比如下面这个图描述的是根据一个人的信息（包括职业、年龄、收入、学历）去判断他是否有贷款的意向的树结构图：

在这里插入图片描述

可以看到，所谓的树结构其实就是一大堆有顺序的if-else条件判断语句的组合，如果职业是什么，走向对应分支，再如果年龄是什么，走向一条分支，一直到没有分支了为止。而我们的决策树就是想建立这样的一个组合条件的树结构，树的最底层给出分类的结果，这样给定一组（职业、年龄、收入、学历）的特征，在这个树结构中过一遍就能得到结果了。有一个宏观的认识我们再来细说决策树的构造过程。

第一步，从我们拥有的数据说起。

上面的树结构是最终的结果，而最开始我们并不知道这个结构，大多数时候我们所拥有的只是训练样本，也就是特征以及标签，比如下面这样：

在这里插入图片描述
在实际情况中，所有的属性都可以数值化表示，比如职业属性的这一栏，可以用1，2，3，4代表不同的职业（工人，白领等），依次类推&

最低0.47元/天解锁文章

关注

12
点赞
踩
30

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。