机器学习—决策树

最新推荐文章于 2023-06-29 17:27:41 发布

BJUT赵亮

最新推荐文章于 2023-06-29 17:27:41 发布

阅读量364

点赞数

分类专栏： python代码文章标签：北京工业大学赵亮机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_22235017/article/details/83510947

版权

本文深入探讨了决策树的三种主要算法：ID3、C4.5和CART。内容包括信息增益、信息增益率、基尼指数的概念及其在选择特征时的作用，以及算法流程、最小二乘回归树和剪枝策略。最后，总结了决策树算法的特点和适用场景。

摘要由CSDN通过智能技术生成

文章目录

分类树（ID3&C4.5&CART分类树）
最小二乘回归树
剪枝
决策树算法总结

本文将记录在《统计学习方法》中有关决策树的内容

分类树（ID3&C4.5&CART分类树）

信息增益

熵表示随机变量的不确定性的程度。X是有有限制的离散随机变量集 $X=\{ x_1,x_2,...,x_N\}$ ,则该数据集的熵为： $\sum_{i=1}^Np_i*log(p_i) \\$
其中 $p_i$ 为第i个数据出现的频率。
熵只依赖X的分布，与X的取值无关，熵越大随机变量的不确定性就越大。
条件熵 $H (Y ∣ X)$ 表示在已知特征A的情况下随机变量Y的不确定程度，定义为 $\sum_{i=1}^N p_iH(Y|X=x_i)\\ p_i = P(X=x_i)\\当p_i = 0时，令0log0 = 0$
在给定数据集D的情况下特征A对于数据集的信息增益g(D,A)，定义为集合X的熵减去特征A下的X的条件熵，定义为 $g (D, A) = H (D) - H (D ∣ A)$

熵 $H (D)$ 与条件熵 $H (D ∣ A)$ 之间的差值称为互信息，决策树中的信息增益等价于训练数据集中类与特征的互信息

信息增益表达特征A对数据集分类的不确定性减少的程度，信息增益大的特征具有更强的分类能信息增益力。
对于数据集D中有 $C = \{C_1,C_2,C_k\}$ 个类别， $C_k|$ 表示第k个类别中样本个数，显然 $\sum_i^k|C_i| = |D|$ ，特征A的取值

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
机器学习—决策树

文章目录算法流程ID3&amp;amp;amp;amp;amp;amp;amp;amp;C4.5信息增益信息增益率CART基尼指数本文将记录在《统计学习方法》中有关决策树的内容算法流程ID3&amp;amp;amp;amp;amp;amp;amp;amp;C4.5信息增益熵表示随机变量的不确定性的程度。X是有有限制的离散随机变量集X={x1,x2,...,xN}X=\{ x_1,x_2,...,x_N\}X={x1,x2,...,xN},则该数据集的熵为：H(X)=−∑i=1
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。