决策树之基尼指数理解

韩立 •

已于 2022-07-15 21:35:29 修改

阅读量4.5k

点赞数 5

分类专栏：机器学习理论学习文章标签：决策树机器学习人工智能

于 2022-06-27 03:24:27 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44386182/article/details/125476972

版权

机器学习理论学习专栏收录该内容

9 篇文章 4 订阅

订阅专栏

基尼指数和信息熵都是用来描述系统混乱度的量数学形式不一样，干的事是一样的

不纯度（impurity）--GINI系数：（不纯度就是混乱度）

公式

例子（与信息熵干的是一件事）

决策树模型理解

二、决策树的学习（训练）过程
一棵决策树的生成过程主要分为以下3个部分:

特征选择：特征选择是指从训练数据中众多的特征中选择一个特征作为当前节点的分裂标准，如何选择特征有着很多不同量化评估标准标准，从而衍生出不同的决策树算法。

决策树生成：根据选择的特征评估标准，从上至下递归地生成子节点，直到数据集不可分则停止决策树停止生长。树结构来说，递归结构是最容易理解的方式。

剪枝：决策树容易过拟合，一般来需要剪枝，缩小树结构规模、缓解过拟合。剪枝技术有预剪枝和后剪枝两种。

第一步：如何切分特征（选择节点）--特征选择

   问题：根节点的选择该用哪个特征呢？接下来呢？如何切分呢？

   目标：通过一种衡量标准，来计算通过不同特征进行分支选择后的分类情况，找出来最好的那个当成根节点，以此类推。

衡量标准-熵、GINI系数(不纯度）

   熵：熵是表示随机变量不确定性的度量
   解释：说白了就是事物内部的混乱程度。

如何决策一个节点的选择呢？（如何确定一个分裂是最好的）

所以需要通过特征挑选方法（信息增益法+增益率）

选择具有最高信息增益的特征作为测试特征，利用该特征对节点样本进行划分子集，会使得各子集中不同类别样本的混合程度最低，在各子集中对样本划分所需的信息（熵）最少（通过这样生成最优决策树）

（注意，信息增益既可以用熵也可以用GINI系数来计算）

关注

5
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
决策树之基尼指数理解

基尼指数和信息熵都是用来描述系统混乱度的量数学形式不一样，干的事是一样的不纯度（impurity）--GINI系数：（不纯度就是混乱度）公式例子（与信息熵干的是一件事）决策树模型理解二、决策树的学习（训练）过程一棵决策树的生成过程主要分为以下3个部分:特征选择：特征选择是指从训练数据中众多的特征中选择一个特征作为当前节点的分裂标准，如何选择特征有着很多不同量化评估标准标准，从而衍生出不同的决策树算法。决策树生成：根据选择的特征评估标准，从上至下递归地生成子节点，直到数据集不可分则停止
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。