决策树算法学习及实践

最新推荐文章于 2024-05-07 17:32:29 发布

张##

最新推荐文章于 2024-05-07 17:32:29 发布

阅读量3.1k

点赞数 1

文章标签：决策树决策树学习心得

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38273255/article/details/88981203

版权

决策树算法学习及实践

代码

ID3：https://blog.csdn.net/weixin_38273255/article/details/88981748

C4.5：https://blog.csdn.net/weixin_38273255/article/details/88981925

CART：https://blog.csdn.net/weixin_38273255/article/details/88792177

原理学习

决策树主要是通过已有数据建立决策树，然后根据建立的决策树来进行预测分析。从根节点开始，对数据进行分割→在众多属性中选择一个收益最大的属性将根节点分裂为众多子节点→最后根据一定的条件停止分裂。其中重点就在于分裂属性的选择。分为信息增益（熵和Gini）、信息增益率三种，分别对应了三种决策树建立算法：ID3、CART、C4.5。

实验结果

数据集使用的是iris数据集，分别对ID3、C4.5和CART三种算法进行试验。

因为ID3和C4.5两个算法实现起来比较相似，首先对ID3和C4.5两个算法做了实现。两者的差别就在于对于分裂属性的选择上，一个采用的是信息增益熵，一个采用的是信息增益率。因为处理的数据集需要是离散的，所以将数据做了离散化。将每个维度的数据排序，按大小等分为了七个区间（尝试了少几个区间，但是发现无法充分利用特征）。因为直接加载的iris数据是连续的，所以将加载的数据进行了打乱，选取前100作为生成决策树的数据，后50作为测试数据。生成树如图1和图2所示，分别是ID3和C4.5的决策树，两个的测试准确率分别为0.96和0.9。

图1 ID3-0.96

图2 C4.5-0.9

该算法与前两个算法的差异在于其选择分裂点事使用Gini值进行选择的，Gini值与之前的ID3的增益熵都是信息增益的一种。右图则是CART算法的实现，算法的实现选择使用的python的sklearn模块实现，数据集也采用的是iris数据集。

关注

1
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
决策树算法学习及实践

决策树算法学习及实践代码ID3：https://blog.csdn.net/weixin_38273255/article/details/88981748C4.5：https://blog.csdn.net/weixin_38273255/article/details/88981925CART：https://blog.csdn.net/weixin_38273255/art...
复制链接

扫一扫

张## CSDN认证博客专家 CSDN认证企业博客

码龄7年

11: 原创

25万+: 周排名

135万+: 总排名

3万+: 访问

: 等级

476: 积分

24: 粉丝

13: 获赞

13: 评论

149: 收藏

私信

关注

热门文章

最新评论

mysqldump导入数据库无反应
CSDN-Ada助手: 非常感谢你的分享！相信你解决了这个问题后也积累了一些经验，不妨写一篇关于mysqldump导入数据库的技术文章，分享给更多的读者。可以从mysqldump的基本用法、常见问题及解决方案、优化导入效率等角度展开，相信读者会对此非常感兴趣，期待你的下一篇博客！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
python实现ID3
m0_53424608: 您好，yanzheng文件好像存在一点问题？
使用python的sklearn实现CART决策树
qq_57908017: 出现No module named 'sklearn.externals.six的原因是：sklearn 0.23版本已经删掉了这个包，直接安装six包，pip install six，然后直接引入， from six import StringIO，摘自其他csdn博主hyluglare的
使用python的sklearn实现CART决策树
张##: 实在不好意思啊，这个都是之前上研究生的时候的一些学习笔记了，现在不从事住一块了，可能没办法帮你解答困惑，万分抱歉！！
使用python的sklearn实现CART决策树
m0_63987287: 我也是，请问你是怎么解决的呢，我按照up主说的装了环境变量还是这样

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。