【机器学习基础】信息熵，联合熵，条件熵，互信息，相对熵，交叉熵

Tuzi_bo

于 2019-04-25 10:57:08 发布

阅读量6.6k

点赞数 10

分类专栏：机器学习文章标签：机器学习熵

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010834867/article/details/89498143

版权

目录

3 条件熵、互信息

3.3 熵之间的关系推导与证明

在机器学习中，信息熵(Entropy)是一个非常重要的概念，因为围绕着熵有着许许多多的应用和算法。信息熵的概念是由香农在1948年提出的，熵这个概念最初源于热力学，热力学中的热熵是表示分子状态混乱程度的物理量。香农用信息熵的概念来描述信源的不确定度。所以，简单来理解，信息熵描述的就是信息的不确定度。

1 信息

在给出信息熵的定义之前，必须要先描述一下信息，一条信息的信息量大小和它的不确定性有直接的关系。我们需要搞清楚一件非常非常不确定的事，或者是我们一无所知的事，就需要了解大量的信息。相反，如果我们对某件事已经有了较多的了解，我们就不需要太多的信息就能把它搞清楚。所以，从这个角度，我们可以认为，信息量的度量就等于不确定性的多少。比如，有人说广东下雪了。对于这句话，我们是十分不确定的。因为广东几十年来下雪的次数寥寥无几。为了搞清楚，我们就要去看天气预报，新闻，询问在广东的朋友，而这就需要大量的信息，信息熵很高。再比如，中国男足进军2022年卡塔尔世界杯决赛圈。对于这句话，因为确定性很高，几乎不需要引入信息，信息熵很低。

考虑一个离散的随机变量，由上面两个例子可知，信息的度量应该依赖于概率分布 p(x) ，因此我们想要寻找一个函数 I(x) ，它是概率 p(x) 的单调函数。怎么寻找呢？如果我们有两个不相关的事件 x 和y，那么观察两个事件同时发生时获得的信息量应该等于观察到事件各自发生时获得的信息之和，即： I(x,y)=I(x)+I(y) 。

因为两个事件是独立不相关的，因此根据概率公式有 p(x,y)=p(x)p(y) 。根据这两个关系，很容易看出I(x)一定与p(x) 的对数有关 (因为对数的运算法则是 log_a(mn)=log_am+log_an 。因此，我们有

最低0.47元/天解锁文章

关注

10
点赞
踩
40

收藏

觉得还不错? 一键收藏
1
评论
【机器学习基础】信息熵，联合熵，条件熵，互信息，相对熵，交叉熵

目录1 信息2 信息熵 3 条件熵、互信息 3.1 条件熵 3.2 互信息 3.3 熵之间的关系推导与证明4 相对熵 5 交叉熵6 参考链接在机器学习中，信息熵(Entropy)是一个非常重要的概念，因为围绕着熵有着许许多多的应用和算法。信息熵的概念是由香农在1948年提出的，熵这个概念最初源于热力学，热力学中...
复制链接

扫一扫

专栏目录

Tuzi_bo CSDN认证博客专家 CSDN认证企业博客

码龄11年

29: 原创

7万+: 周排名

83万+: 总排名

18万+: 访问

: 等级

1282: 积分

72: 粉丝

245: 获赞

27: 评论

1039: 收藏

私信

关注

热门文章

分类专栏

最新评论

【机器学习基础】信息熵，联合熵，条件熵，互信息，相对熵，交叉熵
高性能服务器: 为了更好的理解，需要了解的概率必备知识有：大写字母X表示随机变量，小写字母x表示随机变量X的某个具体的取值； P(X)表示随机变量X的概率分布，P(X,Y)表示随机变量X、Y的联合概率分布，P(Y|X)表示已知随机变量X的情况下随机变量Y的条件概率分布； p(X = x)表示随机变量X取某个具体值的概率，简记为p(x)； p(X = x, Y = y) 表示联合概率，简记为p(x,y)，p(Y = y|X = x)表示条件概率，简记为p(y|x)，且有：p(x,y) = p(x) * p(y|x)。
【机器学习基础】EM算法
shayuhai685: lnx是凹函数？
【机器学习基础】EM算法
amenxi: 确实，初始条件只是说明了样本的结果是基于2个分布的，最后分析得出的结果也是2个分布的概率分布，并不能确定这2个是对应的a或b，除非还有一个条件，比如a的正例出现的概率大于b
【机器学习基础】EM算法
Mia?even: 整理的好棒👍
【机器学习基础】EM算法
lth在海上漂: 我不断的重复这两个值发现后面都不变了

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。