【机器学习】决策树 python（示例+代码）Windows下载及安装 Graphviz

最新推荐文章于 2022-08-25 17:11:46 发布

哩哩的点滴记

最新推荐文章于 2022-08-25 17:11:46 发布

阅读量1.1k

点赞数 1

文章标签：机器学习 python Graphviz

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43759848/article/details/88116800

版权

本文介绍了决策树的基本概念、优缺点，并详细阐述了如何在Python中实现决策树，包括熵和信息增益的概念。文章通过示例展示了如何创建CSV文件并用Python代码生成决策树。最后，讲解了在Windows上安装Graphviz并将.dot文件转换为PDF或PNG进行可视化的过程。

摘要由CSDN通过智能技术生成

决策树

决策树(Decision Tree）是在已知各种情况发生概率的基础上，通过构成决策树来求取净现值的期望值大于等于零的概率，评价项目风险，判断其可行性的决策分析方法，是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干，故称决策树。在机器学习中，决策树是一个预测模型，他代表的是对象属性与对象值之间的一种映射关系。Entropy = 系统的凌乱程度，使用算法ID3, C4.5和C5.0生成树算法使用熵。这一度量是基于信息学理论中熵的概念。

决策树是一种树形结构，其中每个内部节点表示一个属性上的测试，每个分支代表一个测试输出，每个叶节点代表一种类别。

分类树（决策树）是一种十分常用的分类方法。他是一种监管学习，所谓监管学习就是给定一堆样本，每个样本都有一组属性和一个类别，这些类别是事先确定的，那么通过学习得到一个分类器，这个分类器能够对新出现的对象给出正确的分类。这样的机器学习就被称之为监督学习。
在这里插入图片描述
决策树可应用于银行信用自动评估系统

1 决策树的优点：

直观，便于理解，小规模数据集有效

2 决策树的缺点：

处理连续变量不好
类别较多时，错误增加的比较快
规模性一般

3 创建决策树

3.1熵

比特（bit)来衡量信息的多少

在这里插入图片描述
变量的不确定性越大，熵也就越大。

3.2信息增益

信息增益（Information Gain)：Gain(A)=Info(D)-Infor_A(D)
通过A来作为节点分类获取了多少信息。
示例：

最低0.47元/天解锁文章

哩哩的点滴记

关注

1
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
【机器学习】决策树 python（示例+代码）Windows下载及安装 Graphviz

决策树决策树(Decision Tree）是在已知各种情况发生概率的基础上，通过构成决策树来求取净现值的期望值大于等于零的概率，评价项目风险，判断其可行性的决策分析方法，是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干，故称决策树。在机器学习中，决策树是一个预测模型，他代表的是对象属性与对象值之间的一种映射关系。Entropy = 系统的凌乱程度，使用算法ID3, C4....
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。