机器学习算法总结--决策树

最新推荐文章于 2024-08-04 21:08:26 发布

spearhead_cai

最新推荐文章于 2024-08-04 21:08:26 发布

阅读量5.4k

点赞数

分类专栏：机器学习算法文章标签：机器学习算法决策树

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lc013/article/details/55048641

版权

本文深入探讨了决策树的学习过程，包括特征选择、决策树的生成（ID3与C4.5算法）、剪枝策略以及CART算法。强调了信息熵、信息增益和基尼指数在特征选择中的作用，同时讨论了决策树的过拟合问题及其解决方案，如剪枝和交叉验证。文章还涵盖了决策树在分类与回归任务中的应用，并提供了简单的代码实现示例。

摘要由CSDN通过智能技术生成

简介

定义：分类决策树模型是一种描述对实例进行分类的树形结构。决策树由结点和有向边组成。结点有两种类型：内部结点和叶结点。内部结点表示一个特征或属性，叶结点表示一个类。

决策树学习通常包括3个步骤：特征选择、决策树的生成和决策树的修剪。

决策树学习本质上是从训练数据集中归纳出一组分类规则，也可以说是由训练数据集估计条件概率模型。它使用的损失函数通常是正则化的极大似然函数，其策略是以损失函数为目标函数的最小化。

决策树学习的算法通常是一个递归地选择最优特征，并根据该特征对训练数据进行分割，使得对各个子数据集有一个最好的分类的过程。

决策树的生成对应于模型的局部选择，决策树的剪枝对应于模型的全局选择。决策树的生成只考虑局部最优，相对地，决策树的剪枝则考虑全局最优。

特征选择

特征选择的准则通常是信息增益或者信息增益比。

首先是给出信息熵的计算公式 $H(p) = -\sum_{i=1}^{n} p_i log p_i$ ，熵越大，随机变量的不确定性就越大。公式中 $p_i$ 表示随机变量X属于类别 $i$ 的概率，因此 $n$ 表示类别的总数。

条件熵的定义为： H(Y|X)=∑ni=1piH(Y|X=xi)

最低0.47元/天解锁文章

关注

0
点赞
踩
10

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

spearhead_cai 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。