数据分析 | 信息增益与基尼系数的通俗解释（含实例）

月婵婵

已于 2024-07-26 09:30:06 修改

阅读量6.7k

点赞数 40

分类专栏：数据分析文章标签：数据分析机器学习数据挖掘

于 2024-03-11 15:14:33 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44100263/article/details/136623508

版权

本文详细解释了信息增益和基尼系数在决策树中的作用，包括它们的定义、计算方法及在预测顾客是否点甜点的应用实例，强调了两者在数据纯度提升和不纯度衡量上的差异。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

目录

一、信息增益
- 1. 定义
- 2. 计算方法
二、基尼系数
- 1. 定义
- 2. 计算方法
三、区别
三、应用实例
- 1. 计算信息增益
- 2. 计算基尼系数

一、信息增益

关于信息增益，写得非常好非常通俗易懂的文章：
【结合实例】信息增益的计算_怎么计算信息增益-CSDN博客

1. 定义

信息增益是基于信息论的概念，用于度量在给定特征的情况下，数据集的不确定性减少程度。在决策树中，选择能够使得信息增益最大的特征作为划分节点。

2. 计算方法

计算数据集的初始信息熵（Entropy）：衡量数据的不确定性程度。
根据每个特征的取值对数据集进行划分，计算每个划分的条件熵（Conditional Entropy）。
计算每个特征的信息增益，即初始信息熵与条件熵之差。选择信息增益最大的特征作为划分节点。

信息熵计算公式：
$H(Y)=-\sum_{i=1}^{m} p_{i}\log_{2}({p_{i}} )$
条件熵计算公式：
X给定条件下，Y的条件概率分布的熵对X的数学期望
$p(X=x_{i},Y=y_{j}) = p_{ij}, i=1,2,...,n;j=1,2,...,m$
$H(Y|X)=\sum_{x\subset X}^{} p(x)H(Y|X=x)$
$H(Y|X)=-\sum_{x\subset X}^{} \sum_{y \subset Y}^{} p(x,y)\log p(y|x)$

最低0.47元/天解锁文章

博客等级

码龄6年

36
原创

229
点赞

448
收藏

699
粉丝

关注

私信

热门文章

分类专栏

AIGC 1篇
python 8篇
视音频技术 5篇
云计算 7篇
数据分析 2篇
Linux 1篇
数据压缩 12篇

展开全部收起

最新评论

【翻译+论文阅读】DeepSeek-R1评测：粉碎GPT-4和Claude 3.5的开源AI革命
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【翻译+论文阅读】DeepSeek-R1评测：粉碎GPT-4和Claude 3.5的开源AI革命
月婵婵: 视频主要是验证了几个领域的任务，可看可不看，论文要看。
【翻译+论文阅读】DeepSeek-R1评测：粉碎GPT-4和Claude 3.5的开源AI革命
月婵婵: 说实话原文好像车轱辘话来回讲，等我看完原始视频看看还有没有可以补充的内容。
什么是双声道立体声环绕声全景声 | 一文讲清楚沉浸式声音基本设定
月婵婵: 哇！非常感谢，等天亮我就改正！看得好仔细呀！
什么是双声道立体声环绕声全景声 | 一文讲清楚沉浸式声音基本设定
acsars520: 作为科普的Ambisonics入门，已经写的很清楚了。有个错误双耳幅度差应该是ILD 在本文一开始写成了IID 后面的全拼是对的还有一个就是一阶Ambisonics 正常应该写作FOA 至于声场图相似的原因，本质是因为立体声和HOA都是基于MS的基础上变化而来的，最底层的逻辑是一致的其实当前Ambisonics录制和制作还是比较少的，基于audiovivid的制作，现在还是绝大多数是声床+对象的形式，目前还没有遇到过只有HOA数据编码和解码渲染播放的情况，如果我有错误请作者纠正

最新文章

目录

展开全部

收起

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

月婵婵 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。