KL散度的含义与性质

最新推荐文章于 2025-04-03 20:20:31 发布

麒麟437

最新推荐文章于 2025-04-03 20:20:31 发布

阅读量8.4w

点赞数 53

分类专栏：机器学习

机器学习专栏收录该内容

4 篇文章

订阅专栏

在概率论或信息论中，KL散度( Kullback–Leibler divergence)，又称相对熵（relative entropy)，是描述两个概率分布P和Q差异的一种方法。它是非对称的，这意味着D(P||Q) ≠ D(Q||P)。特别的，在信息论中，D(P||Q)表示当用概率分布Q来拟合真实分布P时，产生的信息损耗，其中P表示真实分布，Q表示P的拟合分布。有人将KL散度称为KL距离，但事实上，KL散度并不满足距离的概念，应为:1）KL散度不是对称的；2）KL散度不满足三角不等式。对一个离散随机变量或连续的随机变量的两个概率分布P和Q来说，KL散度的定义分别如下所示。

KL散度在信息论中有自己明确的物理意义，它是用来度量使用基于Q分布的编码来编码来自P分布的样本平均所需的额外的Bit个数。而其在机器学习领域的物理意义则是用来度量两个函数的相似程度或者相近程度，在泛函分析中也被频繁地用到[2]。在香农信息论中，用基于P的编码去编码来自P的样本，其最优编码平均所需要的比特个数（即这个字符集的熵）为：

用基于P的编码去编码来自Q的样本，则所需要的比特个数变为：

于是，我们即可得出P与Q的KL散度

可以利用Jensen不等式证明P与Q之间的KL散度不小于0：

参考资料：[1] KL散度的解释，https://baike.so.com/doc/4949446-5170752.html.

[2] KL散度与Jensen不等式的理解,https://zhuanlan.zhihu.com/p/28249050.

博客等级

码龄8年

5
原创

58
点赞

243
收藏

12
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

最新评论

加权和、卷积与傅立叶变换三者的关系
CSDN-Ada助手: 非常感谢您的分享，这篇博客对加权和、卷积和傅立叶变换的关系阐述得非常清晰，让人受益匪浅。我觉得下一篇博客可以继续深入探讨傅立叶变换在图像处理中的应用，比如如何使用傅立叶变换实现图像滤波、去噪、增强等功能，这样的技术文章对其他用户也会非常有帮助。相信您在这方面一定有很多经验和心得，期待您的分享！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
KL散度的含义与性质
weixin_45846448: 讲的太好了
KL散度的含义与性质
猪鼻大学生: 请问利用Jensen不等式证明P与Q之间的KL散度不小于0的第一行是怎么推导到Ep(x)的那一项的呀
KL散度的含义与性质
fangzeren: 对
KL散度的含义与性质
梦逸清尘: “用基于P的编码去编码来自Q的样本“这句话是不是写反了？应该是”用基于Q的编码去编码来自P的样本“吧？

大家在看

最新文章

目录

展开全部

收起

评论 7

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。