关于信息增益如何计算

一只发呆的猪

已于 2023-12-23 17:49:09 修改

阅读量541

点赞数 8

文章标签：人工智能

于 2023-12-23 17:44:16 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_56180495/article/details/135171519

版权

首先简单介绍一下DT

DT决策树是用于分类（用于分类的问题，如二分类）和回归（是预测连续的问题，如股票）的

信息熵：熵值越大表示数据越不稳定，熵值越小说明数据越稳定

信息增益：信息增益越大，以当前结点进行划分信息的纯度越高，在计算信息增益之前需要先计算信息熵

总体概括：信息熵越小，信息增益越大，信息纯度越高，用当前结点进行属性划分越合适

用西瓜书上的问题来练习如何计算信息熵以及信息增益

信息熵的计算公式：

信息增益的计算公式：

题目如下：

以纹理为例子进行运算：

不区分纹理的种类，好瓜的数目是8/17,坏瓜的数目是9/17

总体的信息熵的计算Ent（D）=-（ $\frac{8}{17}$ $log_{2}\frac{8}{17}$ ）-（ $\frac{9}{17}$ $\log_{2}\frac{9}{17}$ ）

其次以纹理为根节点可分为3类（清晰，稍糊，模糊），3者分别占比9/17,3/17,5/17

清晰的好瓜数目7/9,坏瓜的数目2/9

稍糊的好瓜数目1/3,坏瓜数目2/3

模糊的好瓜的数目0，坏瓜的数目5/5

分别计算3者的信息熵

清晰---Ent（ $^{D1}$ ）=-( $\frac{7}{9}$ $log_{2}\frac{7}{9}$ )-( $\frac{2}{9}$ $log_{2}\frac{2}{9}$ )

稍糊---Ent（ $^{D2}$ ）=-( $\frac{1}{3}$ $log_{2}\frac{1}{3}$ )-( $\frac{2}{3}$ $log_{2}\frac{2}{3}$ )

模糊---Ent（ $^{D3}$ ）=-(0)-( $\frac{5}{5}$ $log_{2}\frac{5}{5}$ )

最后计算以纹理进行划分的信息增益

Gain（D,a）=Ent（D）-(9/17*Ent（ $^{D1}$ ）+3/17*Ent（ $^{D2}$ )+5/17*Ent（ $^{D3}$ ))

就可以得出最后的结果的，其他的计算方法类似

主要的计算思路，先计算总体的信息熵，再分别计算划分结点的熵，最后信息增益=总的熵-（划分计算的占比*划分计算的熵）

一只发呆的猪

关注

8
点赞
踩
14

收藏

觉得还不错? 一键收藏
1
评论
关于信息增益如何计算

信息增益：信息增益越大，以当前结点进行划分信息的纯度越高，在计算信息增益之前需要先计算信息熵。DT决策树是用于分类（用于分类的问题，如二分类）和回归（是预测连续的问题，如股票）的。总体概括：信息熵越小，信息增益越大，信息纯度越高，用当前结点进行属性划分越合适。其次以纹理为根节点可分为3类（清晰，稍糊，模糊），3者分别占比。不区分纹理的种类，好瓜的数目是8/17,坏瓜的数目是9/17。信息熵：熵值越大表示数据越不稳定，熵值越小说明数据越稳定。总体的信息熵的计算Ent（D）=-（分别计算3者的信息熵。
复制链接

扫一扫

一只发呆的猪 CSDN认证博客专家 CSDN认证企业博客

码龄3年

33: 原创

76万+: 周排名

6万+: 总排名

2万+: 访问

: 等级

637: 积分

184: 粉丝

269: 获赞

27: 评论

287: 收藏

私信

关注

热门文章

分类专栏

人工智能 2篇
机器学习 2篇

最新评论

FF++数据集下载脚本代码
一只发呆的猪: 蛮久的，经常中断，不过我只下载了c40的视频
FF++数据集下载脚本代码
m0_62423084: 作者下了多久啊，我换了EU2但是进度一直是0，就这样：0/3068 [00:00<?, ?it/s]
FF++数据集下载脚本代码
Tiamo_wey: 博主，您好。请问数据集下载下来了吗？能否分享一份呢？十分感谢~
FF++数据集下载脚本代码
2301_77487668: 请问博主现在下载好了吗，可以分享一份嘛
关于空频变换的知识点
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。