与信息熵相关的概念梳理(条件熵/互信息/相对熵/交叉熵)

最新推荐文章于 2024-05-26 08:37:15 发布

DASEason

最新推荐文章于 2024-05-26 08:37:15 发布

阅读量5.7k

点赞数 4

分类专栏：数据挖掘机器学习最优化问题文章标签：信息论熵交叉熵相对熵互信息

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq547276542/article/details/78370245

版权

香农信息量

信息量表示不确定性的大小。 信息量的单位是比特（bit）。

$香农信息量=\log\frac{1}{p}=-\log p\quad(以2为底)$

上式中，p越小，则不确定性越大，包含的信息量就越多。比如32支球队，在无任何先验信息的前提下，用二分法猜冠军队伍，最多猜5次，那么信息量就是 $\log \frac{1}{32}=5$ 。

信息熵（Entropy）

用于衡量信息量和变量的不确定度。熵越大，所涵盖的信息量越大，变量的不确定度越大。对于任意一个随机变量X，它的熵定义如下：
$H(X)=-\sum_{x\in X}P(x)\log P(x)$
当X中每个x的概率P(x)相等时，X的不确定度最大，熵最大，也就是其涵盖的信息量最大。

熵的概念来源于热力学中的熵，代表系统中的混乱程度（也就是不确定度）。熵越大，系统越混乱，越接近与均匀分布。（很容易想象，如果系统的分布很不均匀，也就是有某种规律在里面，那么系统的混乱程度就低）

条件熵（Conditional Entropy）

条件熵的含义是：假定X和Y是两个随机变量。现在我们知道X和Y同时出现的概率（联合分布），以及在Y取不同值的前提下X的概率分布（条件概率分布）。那么定义X在Y的条件下的条件熵为：
$H(X|Y)=-\sum_{x\in X,y\in Y}P(x,y)logP(x|y)$

最低0.47元/天解锁文章

关注

4
点赞
踩
17

收藏

觉得还不错? 一键收藏
1
评论
与信息熵相关的概念梳理(条件熵/互信息/相对熵/交叉熵)

香农信息量信息量表示不确定性的大小。信息量的单位是比特（bit）。香农信息量=log1p=−logp(以2为底)香农信息量=\log\frac{1}{p}=-\log p\quad(以2为底)上式中，p越小，则不确定性越大，包含的信息量就越多。比如32支球队，在无任何先验信息的前提下，用二分法猜冠军队伍，最多猜5次，那么信息量就是log132=5\log \frac{1}{32}=5。信息熵（En
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。