[200908] 熵，交叉熵，KL散度

最新推荐文章于 2022-11-15 20:17:37 发布

ShaneRun

最新推荐文章于 2022-11-15 20:17:37 发布

阅读量195

点赞数

分类专栏： Math 文章标签：交叉熵 KL散度

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46841421/article/details/108468958

版权

Math 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

[200908] 熵，交叉熵，KL散度

信息熵（Entropy）

信息熵（Entropy）是衡量分布的混乱程度或分散程度的一种度量。分布越分散(或者说分布越平均)，信息熵就越大。分布越有序（或者说分布越集中），信息熵就越小。(https://www.cnblogs.com/soyo/p/6893551.html)

信息熵用bit位数来定量表示。
$-\sum{p_i*\log_2{p_i}}$
其中 $p_i$ 为X中第i个元素的发生概率，范围是[0,1]

信息熵越大表明样本集S分类越分散，信息熵越小则表明样本集X分类越集中。。当S中n个分类出现的概率一样大时（都是1/n），信息熵取最大值log2(n)。当X只有一个分类时，信息熵取最小值0

交叉熵（Cross Entropy）

交叉熵（Cross Entropy）是Shannon信息论中一个重要概念，主要用于度量两个概率分布间的差异性信息。(https://baike.baidu.com/item/%E4%BA%A4%E5%8F%89%E7%86%B5/8983241)

在机器学习中，经常被用作损失函数。损失最小，则学习到的概率分布就越接近真实分布。

假设现在有一个样本集中两个概率分布p,q，其中p为真实分布，q为预测分布，则交叉熵可以表示为：
$-\sum{p_i*\log_2{q_i}}$

H(p,q) >= H§

在信息论里，直观理解为采用预测分布q来表示来自真实分布p的平均编码长度。

在监督学习的分类任务中，经常用自然对数的形式。即
$-\sum{p_i*\log{q_i}}$
两者实际上是类似的，因为有如下比例关系：
$\frac{log10}{log2} H(p,q)$

KL散度

Kullback-Leibler Divergence，即K-L散度，是一种量化两种概率分布P和Q之间差异的方式，又叫相对熵。在概率学和统计学上，我们经常会使用一种更简单的、近似的分布来替代观察数据或太复杂的分布。K-L散度能帮助我们度量使用一个分布来近似另一个分布时所损失的信息量。(https://www.jianshu.com/p/43318a3dc715)

简单一点，就是KL散度表征了两个分布之间的差异。散度越大，两个分布的差异也越大。KL散度和熵，以及交叉熵之间有如下关系：

$D_{KL}(p,q) = H(p,q) - H(p)$
因为H(p,q) >= H§，所以KL散度为正数。

同样以监督学习为例：如果预测分布越接近真是分布，则KL散度值越接近0.

很自然地，一些同学把K-L散度看作是不同分布之间距离的度量。这是不对的，因为从K-L散度的计算公式就可以看出它不符合对称性（距离度量应该满足对称性）。

$D_{KL}(p,q) = H(p,q) - H(p) \not ={H(q,p)-H(q) = D_{KL}(q,p)}$

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
[200908] 熵，交叉熵，KL散度

[200908] 熵，交叉熵，KL散度信息熵（Entropy）信息熵（Entropy）是衡量分布的混乱程度或分散程度的一种度量。分布越分散(或者说分布越平均)，信息熵就越大。分布越有序（或者说分布越集中），信息熵就越小。(https://www.cnblogs.com/soyo/p/6893551.html)信息熵用bit位数来定量表示。H(p)=−∑pi∗log⁡2pi H(p) = -\sum{p_i*\log_2{p_i}}H(p)=−∑pi∗log2pi其中pip_ipi为X中
复制链接

扫一扫

专栏目录

ShaneRun CSDN认证博客专家 CSDN认证企业博客

码龄4年

96: 原创

9万+: 周排名

218万+: 总排名

4万+: 访问

: 等级

1005: 积分

6: 粉丝

22: 获赞

1: 评论

50: 收藏

私信

关注

热门文章

分类专栏

Use Linux 13篇
随笔 8篇
Think 3篇
Embedded System 3篇
Use Python 12篇
Use VSCode 5篇
C 2篇
ML_HYLEE_2020 2篇
Use LaTeX 4篇
VoxSRC20 19篇
SpR 1篇
Math 5篇
Use Git&Github 10篇
Use Markdown 4篇
Control 1篇
Compute 1篇
Archive 2篇
Use Pytorch 1篇
AI小故事 1篇

最新评论

[210121] install nvidia driver via ssh
LaoYuanPython: 抢到沙发，谢谢分享！原创不易，必须支持！伙计，加油! 不好意思拉个票，本人正参与博客之星评选，今天是投票最后一天，如方便敬请支持！谢谢！投票链接：[code=python] https://bss.csdn.net/m/topic/blog_star2020/detail?username=laoyuanpython [/code] 或到老猿博文首页内的置顶博文跳转！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。