机器学习-决策树

最新推荐文章于 2024-05-12 21:09:09 发布

小浩子7号

最新推荐文章于 2024-05-12 21:09:09 发布

阅读量105

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41782791/article/details/115917243

版权

机器学习专栏收录该内容

13 篇文章 0 订阅

订阅专栏

决策树(Decision Tree）是在已知各种情况发生概率的基础上，通过构成决策树来求取净现值的期望值大于等于零的概率，评价项目风险，判断其可行性的决策分析方法，是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干，故称决策树。在机器学习中，决策树是一个预测模型，他代表的是对象属性与对象值之间的一种映射关系。Entropy = 系统的凌乱程度，使用算法ID3, C4.5和C5.0生成树算法使用熵。这一度量是基于信息学理论中熵的概念。

先引入信息熵的概念

信息是个很抽象的概念。人们常常说信息很多，或者信息较少，但却很难说清楚信息到底有多少。比如一本五十万字的中文书到底有多少信息量。

直到1948年，香农提出了“信息熵”的概念，才解决了对信息的量化度量问题。信息熵这个词是C.E.Shannon（香农）从热力学中借用过来的。热力学中的热熵是表示分子状态混乱程度的物理量。香农用信息熵的概念来描述信源的不确定度。

信息熵越大，信息的不确定性越大

根据信息增益的大小来划分，把不确定性大的，放在前面

二、划分决策树的方法

三、用决策树预测代码

如果想找pandas显示所有隐藏行，需要加入代码

 pd.set_option('display.max_columns', None)
    pd.set_option('display.max_rows', None)

四、将决策树划分过程可视化

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

博客等级

码龄7年

64
原创

7
点赞

58
收藏

35
粉丝

关注

私信

分类专栏

机器学习 13篇
python 48篇

最新评论

机器学习-随机森林（集成学习方法）
LaoYuanPython: 运气不错能抢到评论区首发！辛苦博主的案例代码分享！亲，请问对一个人工智能的小白来说，请问怎么去学习AI？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。