机器学习—决策树

最新推荐文章于 2024-07-25 21:10:30 发布

weixin_46517201

最新推荐文章于 2024-07-25 21:10:30 发布

阅读量812

点赞数 25

文章标签：机器学习决策树

本文链接：https://blog.csdn.net/weixin_46517201/article/details/136430095

版权

本文详细介绍了决策树的构建过程，包括特征选择（基于信息熵和信息增益）、分裂条件（如节点纯度、深度限制等）、独热编码方法，以及回归树、随机森林和XGBoost等变种的原理。特别强调了决策树在处理结构化数据的优势和适用场景，与神经网络的对比。

摘要由CSDN通过智能技术生成

决策树的构建

·选择哪个特征进行分类（目标最大纯度/最小杂质）
·选择什么时候停止分裂：
1.一个节点100%都是一类
2.超过最大深度
3.纯度提升过小（小于一定阈值）
4.一个节点上的样本太少（小于一定阈值）

信息熵

熵：描述事件的不确定性;衡量一组数据杂质的度量
$p_0 = 1-p_1$
$H(p_1)=-p_1log_2(p_1)-p_0log_2(p_0)$
$H(p_1)=-p_1log_2(p_1)-(1-p_1)log_2(1-p_1)$
在这里插入图片描述

分裂前信息熵：H(0.5)（10只动物，5只猫，p=0.5）
分裂后左分支：H(0.8)（7只动物，4只猫，p=0.57）
分裂后右分支：H(0.2)（3只动物，1只猫，p=0.33）
分裂后总信息熵： $\frac{7}{10}H(0.8)+\frac{3}{10}H(0.2)$
信息增益： $H(0.5)-(\frac{7}{10}H(0.8)+\frac{3}{10}H(0.2))$
在决策树分裂过程中，尝试不同的阈值进行分割，选择信息增益最大的阈值作为决策树的分割点。

独热编码

将离散特征转化为连续特征
如下，10011，00101，00110等，为独热编码
在这里插入图片描述

回归树

通过树的分类进行回归，目标是同一叶子节点内方差最小
在这里插入图片描述
分裂前总方差：20.51
分裂后左分支方差：1.47
分裂后右分支：21.87
信息增益： $20.51-(\frac{5}{10}·1.47+\frac{5}{10}·21.87)$

随机森林

将总体样本进行放回抽样，制造不同的训练集（训练集内部也可重复）
利用不同训练集训练出不同的决策树，同一样本在不同的树下可能是不同的结果
进行预测时，根据所有树（森林）的分类结果进行投票，输出分类结果

XGBOOST

根据上一颗树的结果的残差拟合下一颗树

决策树的选择使用

适合处理结构性数据，不适合音频图像文本
训练速度很快
小规模的决策树是人可以进行解释的

神经网络的选择使用

适合各类数据处理
训练速度可能很慢
可以用迁移学习一起工作
容易和其他神经网络串联到一起构建一个系统的机器学习系统

weixin_46517201

关注

25
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
机器学习—决策树

在决策树分裂过程中，尝试不同的阈值进行分割，选择信息增益最大的阈值作为决策树的分割点。利用不同训练集训练出不同的决策树，同一样本在不同的树下可能是不同的结果。将总体样本进行放回抽样，制造不同的训练集（训练集内部也可重复）进行预测时，根据所有树（森林）的分类结果进行投票，输出分类结果。分裂前信息熵：H(0.5)（10只动物，5只猫，p=0.5）分裂后左分支：H(0.8)（7只动物，4只猫，p=0.57）分裂后右分支：H(0.2)（3只动物，1只猫，p=0.33）4.一个节点上的样本太少（小于一定阈值）
复制链接

扫一扫