信息熵、条件熵、信息增益

最新推荐文章于 2023-06-20 14:18:41 发布

xtingjie

最新推荐文章于 2023-06-20 14:18:41 发布

阅读量6.2k

点赞数 3

分类专栏：机器学习文章标签：信息熵

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xtingjie/article/details/71305409

版权

机器学习专栏收录该内容

16 篇文章 3 订阅

订阅专栏

信息增益描述了一个特征带来的信息量的多少，往往用于特征选择

信息增益 = 信息熵 - 条件熵

一个特征往往会使一个随机变量Y的信息量减少，减少的部分就是信息增益

一个例子

这里写图片描述

如图所示，目标值是：playtennis，也就是是否打球
有四个特征：天气、温度、湿度、风

信息熵

信息熵的公式：
$H(X)=-\sum\limits_{i=1} ^{n} p(x_i)\log p(x_i)$
以上图为例，设是否打球这一随机变量为Y，则

$p(y=yes)=\frac{5}{14}$

$p(y=no)=\frac{9}{14}$

所以 $H(Y)=-\frac{5}{14}*log(\frac{5}{14})-\frac{9}{14}*log(\frac{9}{14})=0.6518$

条件熵

条件熵表示在条件X下Y的信息熵。公式如下：

$H(Y|X)=\sum\limits_{x\in X}p(x)H(Y|X=x)$

在上图的例子中，设humidity湿度为随机变量X

则，p(x=high)=7/14=1/2=p1

p(x=normal)=7/14=1/2=p2

所以，H(Y|X)=p1*H(Y|X=high)+p2*H(Y|X=normal)

而接下来就是计算H(Y|X=high)和H(Y|X=normal)

根据信息熵的计算方法可以得出：

H(Y|X=high)=-4/7*log(4/7)-3/7*log(3/7) = 0.6829
H(Y|X=normal)=-1/7*log(1/7)-6/7*log(6/7) = 0.4101

因此，条件熵为：1/2*0.6829+1/2*0.4101=0.5465

信息增益

信息增益 = 信息熵 - 条件熵=0.6518-0.5465=0.1053
也就是说，引入了湿度humidity这个变量之后，就使得是否打球这个变量的信息量就从0.6518减小到了0.5465
信息量是描述变量的不确定性的，值越大，就表示这个事件越不确定
因此，湿度这个变量的引进，使得这种不确定性降低了，有利于做决定

信息增益常用于决策树的构建，和特征选择

关注

3
点赞
踩
9

收藏

觉得还不错? 一键收藏
1
评论
信息熵、条件熵、信息增益

信息增益描述了一个特征带来的信息量的多少，往往用于特征选择信息增益 = 信息熵 - 条件熵一个特征往往会使一个随机变量Y的信息量减少，减少的部分就是信息增益一个例子如图所示，目标值是：playtennis，也就是是否打球有四个特征：天气、温度、湿度、风信息熵信息熵的公式： H(X)=−∑i=1np(xi)logp(xi)H(X)=-\sum\limits_{i=1} ^{n} p(x_i)\l
复制链接

扫一扫

专栏目录

xtingjie CSDN认证博客专家 CSDN认证企业博客

码龄7年

76: 原创

5万+: 周排名

45万+: 总排名

93万+: 访问

: 等级

4446: 积分

101: 粉丝

409: 获赞

48: 评论

1277: 收藏

私信

关注

热门文章

分类专栏

HTML JavaScript CSS 16篇
笔记 1篇
算法 1篇
PPT 2篇
MATLAB 12篇
markdown编辑器 3篇
遗传算法 3篇
office 6篇
神经网络 3篇
支持向量机 2篇
强化学习 2篇
Python 23篇
numpy 5篇
scipy 1篇
matplotlib 3篇
机器学习 16篇
sklearn 2篇
python爬虫 3篇

最新评论

python爬虫：抓取页面上的超链接
m0_73724599: 为什么会爬出非超链接的东西
scipy常数
Chasing Aurora: 放屁，e是自然常数，那是电子好吗？
HTML+JavaScript实现在浏览器里自由画线1.0
m0_71020588: 你好老师，这个代码，我运行后，成功了，前面是忘了保存，刚才重新看了一下，保存后运行，能在html浏览器上，进行鼠标涂鸦了，现在是几个问题，1，这个是白底的颜色，能否把颜色改为透明色，2，这个涂鸦区域是固定的，能否自定义为能在整个屏幕上批注，3，能否把这个web上批注的功能，作成是一个叠加图层，叠加在电脑幕屏（或web浏览器的）任意一个界面上，不管是游戏还是视频还是网页还是wps，都可以叠加在这些界面上，4，还是应该开发几个批注的工具菜单，线条可以换颜色，线条可以调粗细，5，可以定一个白板批注状态，透明批注状态，黑板批注状态，青绿色批注状态（就象学校教室的黑板是青绿色），6，有一个键是能清空批注，有撤销，有像皮擦，……还能一键截图保存当前的屏幕批注画面到指定的文件夹，还可以一键录屏，把批注过程录制成一个视频，保存到指定文件夹，以上，盼老师能继续开发，谢了！
HTML+JavaScript实现在浏览器里自由画线1.0
m0_71020588: 我看了一下您的代码，是要用鼠标来作这个按下左键进入这个操作界面，您可以看一下epic pen，这个软件可以配手写板，用手写笔在wacom手写板上进行屏幕批注，很方便的
HTML+JavaScript实现在浏览器里自由画线1.0
m0_71020588: 您好老师，我把您这个代码导入到vscode，运行，没有成功，我是想弄一个屏幕批注，类似于win系统的那个epic pen软件，可以叠加在任何一个屏幕或软件的界面上，不管这个软件界面是视频的还是网页的还是word还是游戏，它都在叠加在这些界面上，任意写字，不知能否加您微信，好好交流一下，能否复刻一个epic pen那样的软件，谢谢了

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。