DataWhale-202110 树模型与集成学习（第一次）

最新推荐文章于 2022-05-15 21:31:25 发布

Kevin_0629

最新推荐文章于 2022-05-15 21:31:25 发布

阅读量157

点赞数

文章标签：机器学习算法 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Snoopy0629/article/details/120773881

版权

本文介绍了树模型在机器学习中的应用，特别是决策树的构建过程，包括信息熵、信息增益、节点纯度等概念，并探讨了CART树的分裂标准以及如何处理连续值和缺失值的问题。此外，还讨论了决策树的剪枝策略，以防止过拟合。

摘要由CSDN通过智能技术生成

DataWhale-202110 树模型与集成学习

信息论的基础
分类树的节点分裂
- 深度优先增长于最佳增益增长
CART树
- 均方误差（熵）平均绝对误差（条件熵）
决策树剪枝
知识回顾

信息论的基础

正如文档里面所说的一样，树具有一定的天然分支结构，在机器学习中有分类与回归两大问题，而分类问题中，树的分支结构起到一定的关键作用，首先引入的是节点纯度的概念

节点纯度

节点纯度反映的是节点样本标签的不确定性，当一个节点纯度较低的时候，说明分类的不确定性较高，而节点纯度较高的时候，代表着我们能够把握这个节点的具体信息，确定性较高

不确定性函数 $H (P)$

$H(p_1,...,p_n)=-C\sum_{i=1}^np_i\log p_i$
其中满足信息熵条件是：

$H$ 关于 $p_i$ 是连续函数。
若 $p_1=...=p_n$ ，则 $H$ 关于 $n$ 单调递增。
若将某一个 $p_i$ 拆分为 $p_{i1}$ 和 $p_{i2}$ ，即 $p_{i1}+p_{i2}=p_i$ ，则
$H(p_1,...,p_{i-1},p_{i+1},...,p_n,p_{i1},p_{i2})=H(p_1,...,p_n)+p_iH(\frac{p_{i1}}{p_i}, \frac{p_{i2}}{p_i})$

对于定义在有限状态集合 ${y_1,...,y_K\}$ 上的离散变量而言，对应信息熵的最大值在离散均匀分布时取到，最小值在单点分布时取到。此时，离散信息熵为
$H(Y)=-\sum_{k=1}^K p(y_k)\log_2p(y_k)$

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。