信息熵、交叉熵、KL散度、JS距离

最新推荐文章于 2022-10-20 12:55:41 发布

「已注销」

最新推荐文章于 2022-10-20 12:55:41 发布

阅读量119

点赞数

分类专栏：深度学习知识

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/YJYS_ZHX/article/details/112327304

版权

深度学习知识专栏收录该内容

10 篇文章 0 订阅

订阅专栏

本文探讨了信息熵的概念，它是衡量随机变量不确定性的重要指标。接着，介绍了交叉熵和相对熵（KL散度），用于度量分布之间的差异。尽管KL散度不满足距离度量的性质，但通过修正得到的JS散度则满足这些要求，常在生成对抗网络（GANs）等应用中使用。文章深入浅出地阐述了这些概念及其在信息理论和机器学习中的作用。

摘要由CSDN通过智能技术生成

文章：距离度量–熵，KL散度，JS散度，GAN相关应用
信息量

信息量描述为消除随机变量不确定性所需要的信息量多少。某个事件越不确定，所需要的信息也就越多，才能够让其确定下来。比如买衣服是否合身，是十分不确定的，如果提供了肩宽、胸围、腰围、臀围等信息，那么不确定性就降低了，如果直接是裁缝直接来量着做，臂长、肩宽、胸围、腰围、上身长、臀围等等都量一遍，那么做出来的衣服很难不合身，此时不确定性几乎为零。也就是，提供的信息越多，事件的不确定性也就降低了。

随机事件的概率在（0,1）之间，描述信息量的大小采用log函数的（0,1）部分，并将其上下颠倒：

公式如下：

信息熵

信息熵描述随机变量X在整个样本空间上的不确定性，或者需要的信息量大小。上式描述的是在某个取值的时候包含的信息量，而此时在整个样本空间上就需要加权求和。也就是求期望值。

交叉熵
p为真实分布，而q为拟合分布。对于拟合分布要消除不确定性需要的信息熵的大小为：

相对熵或 KL散度
衡量真实的信息熵与拟合分布的信息熵之间的差值：相对熵 = 交叉熵 - 信息熵，其描述的是两个分布之间的差异。

在这里插入图片描述
其不能作为距离，不满足对称性以及三角不等式：

JS距离

由于KL散度不满足距离的要求，通过修改，使其满足要求即可：
在这里插入图片描述

「已注销」

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。