机器学习十大经典算法之决策树

卑微小鹿

于 2022-04-06 18:12:36 发布

阅读量920

点赞数

分类专栏： python 机器学习文章标签：机器学习 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_56618414/article/details/123941819

版权

python 同时被 2 个专栏收录

3 篇文章 0 订阅

订阅专栏

3 篇文章 0 订阅

订阅专栏

决策树是机器学习中用于分类的经典算法，其结构包括根节点、内部节点和叶节点。信息熵和基尼指数是衡量数据纯度的标准，用于选择最佳分割属性。在构建过程中，需避免过拟合，可通过剪枝策略简化决策树。本文探讨了ID3、C4.5和C5.0等算法，并阐述了构建决策树的关键步骤和重要决策，如选择合适属性作为节点及确定停止条件。

摘要由CSDN通过智能技术生成

决策树是机器学习的一种经典算法：

决策树，就如他的名字吧，是一个数字是树状结构，树是在大学期间学过的一个数据结构。

有点类似于一个分类的树，

现在决策树的生成算法有ID3, C4.5和C5.0等，已经发展比较久了。

其中每个内部节点表示一个属性上的判断，每个分支代表一个判断结果的输出，最后每个叶节点代表一种分类结果

其中运用到了有监管学习，监管学习是一种有标签的样本，每一个样本都有一组属性和一个分类结果，也就是分类结果已知，通过这些样本的学习，来识别新的样本

那么我们如何构建决策树呢？

构造决策树的过程实际上就是选择什么属性作为节点的过程，在构造过程中会存在三种节点：

根节点：就是树的最顶端，最开始的那个节点
内部节点：就是树中间的那些节点
叶节点：就是树最底部的节点，也就是决策结果。

节点之间有父子关系，就比如说是，父节点有子节点，叶子节点没有子节点，

从这里我可以看出需要那些解决的问题：

选择哪个属性作为根节点；
选择哪些属性作为子节点；
什么时候停止并得到目标状态，即叶节点

其中是选择根节点最重要

防止决策树过拟合，需要给决策树进行裁剪，就是去除那些非必要的判断

构建决策树

1.首先，我们要明确自已的目标：将进入树的数据，更好的分类出来

纯度：决策树的构建实际上就是在寻找纯净划分的过程，我们寄希望于通过一个节点就可以区分是或者不是

信息熵：表示了信息的不确定度 换句话说就是数据的混沌程度，不确定性越大，信息熵越大，纯度就越小

信息熵的数学公式如下：

子节点的加权基尼越低越好

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

卑微小鹿 CSDN认证博客专家 CSDN认证企业博客

码龄3年

55: 原创

1万+: 周排名

2万+: 总排名

6万+: 访问

: 等级

994: 积分

309: 粉丝

429: 获赞

2: 评论

593: 收藏

私信

关注

热门文章

分类专栏

tensorflow 12篇
机器学习 3篇
服务器 1篇
python 3篇
爬虫 1篇

最新评论

c++（基础）
wenqingzhoug: [code=cpp] #include<iostream> using namespace std; int main() { cout << "6" << endl; system("pause"); return 0; } [/code]
决策树总结
征途黯然.: This article about 决策树总结 is truly deep and outstanding.
fashion minst
weixin_57014252: 代码警告等级，2级开始警告。
tensorflow中lstm_layers实战
半支情15: 你这不纯纯的抄龙老师的课件吗2

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。