决策树原理详解及python代码实现

最新推荐文章于 2021-08-03 20:02:57 发布

ecnu_frc_new

最新推荐文章于 2021-08-03 20:02:57 发布

阅读量1.8k

点赞数 6

分类专栏：机器学习算法（分类）文章标签：决策树算法 python 机器学习数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41851055/article/details/106234426

版权

本文详细介绍了决策树的三种算法：ID3、C4.5和Cart，包括各自的原理、优缺点以及如何处理缺失值。通过比较，强调了决策树在数据分类和回归中的应用，并提供了Python代码实现的步骤，包括数据处理、模型训练和评估。同时，讨论了决策树过拟合的解决方法和调参注意事项。

摘要由CSDN通过智能技术生成

决策树算法（信贷中常用来寻找规则）

1、算法原理
2、ID3、C4.5与Cart比较
3、算法优缺点
4、算法需要注意的点
5、python代码实现

1、算法原理

1.1 ID3（多叉树分类）

信息熵： $Ent(D)=-\sum_{i=1}^np_ilogp_i$ 其中n为类别， $p_i$ 为每个类别的概率， $D$ 为某个特征，越小越确定

信息增益： $Gain(D,a)=Ent(D)=-\sum_{v=1}^v\frac{|D^v|}{|D|}Ent(D^v)$ 越大纯度提升越大，所以分裂 $a r g m a x G a i n (D, a)$

eg.15个样本，9个1和6个0；有个特征A（取值 $A_1$ 、 $A_2$ 、 $A_3$ ，其中 $A_1$ （3个1，2个0），其中 $A_2$ （2个1，3个0）其中 $A_3$ （4个1，1个0））

$Ent(A)=-(\frac{9}{15}*log_2\frac{9}{15}+\frac{6}{15}*log_2\frac{6}{15})=0.971$

最低0.47元/天解锁文章

关注

6
点赞
踩
25

收藏

觉得还不错? 一键收藏
2
评论
决策树原理详解及python代码实现

决策树算法（信贷中常用来寻找规则）1、算法原理1.1 ID3（多叉树分类）1.2 C4.5（多叉树分类）1.3 Cart（二叉树分类+回归）2、ID3、C4.5与Cart比较3、算法优缺点4、算法需要注意的点5、python代码实现5.1导入相关包5.2 读取数据并数据处理5.3 模型训练5.4 评估指标5.4 决策树以图的形式输出1、算法原理1.1 ID3（多叉树分类）信息熵：Ent(D)=−∑i=1npilogpiEnt(D)=-\sum_{i=1}^np_ilogp_iEnt(D)=−∑i=1n
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。