信息熵的计算公式_信息熵、条件熵、联合熵、互信息、相对熵、交叉熵

最新推荐文章于 2024-07-24 17:03:56 发布

weixin_39628945

最新推荐文章于 2024-07-24 17:03:56 发布

阅读量5.1k

点赞数

文章标签：信息熵的计算公式联合概率分布

本文详细介绍了信息熵、条件熵、联合熵、互信息以及它们之间的关系。信息熵表示信息的不确定性，条件熵是在已知某种条件下的熵，联合熵描述两个随机变量共同的不确定性，互信息则表示两个变量之间的相关性。此外，还讨论了相对熵（KL散度）和交叉熵，并指出它们与熵的关系。

摘要由CSDN通过智能技术生成

点击上方“机器学习与统计学”，选择“置顶”公众号

重磅干货，第一时间送达

信息熵、联合熵、条件熵、互信息的关系

1、信息量

信息量是通过概率来定义的：如果一件事情的概率很低，那么它的信息量就很大；反之，如果一件事情的概率很高，它的信息量就很低。简而言之，概率小的事件信息量大，因此信息量可以定义如下：

下面解释为什么要取倒数再去对数。

(1)先取倒数：这件事表示：“信息量”和“概率”呈反比；

(2)在取对数：取对数是为了将区间映射到。

再总结一下：

2、信息熵

信息熵是信息量的数学期望。理解了信息量，信息熵的定义式便不难理解。定义如下：

熵越小表示越“纯”，决策树算法在进行特征选择时的其中标准之一就是选择使得通过该特征分类以后的类的熵最小；
上面是熵越小越好，而有的时候，我们需要熵越大越好，简单来说就是“鸡蛋不要放在一个篮子里”(见吴军《数学之美》)，最大熵原理就是这样，这部分内容可以参考李航《统计机器学习》逻辑回归模型相关部分。

3、条件熵

条件熵的定义为：在给定的条件下，

最低0.47元/天解锁文章

weixin_39628945

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
信息熵的计算公式_信息熵、条件熵、联合熵、互信息、相对熵、交叉熵

点击上方“机器学习与统计学”，选择“置顶”公众号重磅干货，第一时间送达信息熵、联合熵、条件熵、互信息的关系1、信息量信息量是通过概率来定义的：如果一件事情的概率很低，那么它的信息量就很大；反之，如果一件事情的概率很高，它的信息量就很低。简而言之，概率小的事件信息量大，因此信息量可以定义如下：下面解释为什么要取倒数再去对数。(1)先取倒数：这件事表示：“信息量”和“概率”呈反比；(2)...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。