机器学习基础（五十八）—— 香农熵、相对熵（KL散度）与交叉熵

最新推荐文章于 2025-04-23 13:13:39 发布

五道口纳什

最新推荐文章于 2025-04-23 13:13:39 发布

阅读量1.7w

点赞数 4

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lanchunhui/article/details/51277608

版权

机器学习专栏收录该内容

121 篇文章

订阅专栏

1. 香农熵（Shannon entropy）

信息熵（又叫香农熵）反映了一个系统的无序化（有序化）程度，一个系统越有序，信息熵就越低，反之就越高。

如果一个随机变量 $X$ 的可能取值为 $X=\{x_1,x_2,\ldots,x_n\}$ ，对应的概率为 $p(X=x_i)$ ，则随机变量 $X$ 的信息熵为：

H (X) = - \sum i = 1 n p (x i) log p (x i)

$H(X)=-\sum_{i=1}^np(x_i)\log p(x_i)$

2. 相对熵（relative entropy）

所谓相对，自然在两个随机变量之间。又称互熵，Kullback–Leibler divergence（K-L 散度）等。设 $p(x)$ 和 $q(x)$ 是 $X$ 取值的两个概率分布，则 $p$ 对 $q$ 的相对熵为：

D (p | | q) = \sum i = 1 n p (x) log p ( x ) q ( x )

$D(p||q)=\sum_{i=1}^n p(x)\log\frac{p(x)}{q(x)}$
在一定程度上，熵可以度量两个随机变量的距离。KL 散度是两个概率分布 P 和 Q 差别的非对称性的度量。KL 散度是用来度量使用基于 Q 的编码来编码来自 P 的样本平均所需的额外的位元数。

典型情况下，P 表示数据的真实分布，Q 表示数据的理论分布，模型分布，或 P 的近似分布。

相对熵的性质，相对熵（KL散度）有两个主要的性质。如下

（1）尽管 KL 散度从直观上是个度量或距离函数，但它并不是一个真正的度量或者距离，因为它不具有对称性，即

D (p | | q) \neq D (q | | p)

$D(p||q) \neq D(q||p)$

（2）相对熵的值为非负值，即

$D (p | | q) \geq 0$ $D(p||q)\geq 0$

在证明之前，需要认识一个重要的不等式，叫做吉布斯不等式。内容如下

这里写图片描述

这里提供一个离散型 KL 散度的简单实现：

from functools import reduce
import operator
import math

def kl(p, q):
    return reduce(operator.add, map(lambda x, y: x*math.log(x/y), p, q))

3. 交叉熵（cross entropy）

$H(p, q)=-\sum_x p(x)\log q(x)$

五道口纳什

博客等级

码龄14年

3595
原创

3969
点赞

9533
收藏

7438
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: Python web —— webbrowser + feedparser 网络爬虫刷博器

下一篇：: 【笔试/面试】—— Linux 查看 cpu 和内存使用情况

最新评论

[Math Processing Error] 问题的解决（F5刷新页面与 Ctrl/Shift + F5 刷新页面的区别）
qq_46380278: 有的能解决有的网站好像也没用
[Math Processing Error] 问题的解决（F5刷新页面与 Ctrl/Shift + F5 刷新页面的区别）
2301_81505543: 还有没有其他方法啊，ctrl+f5不刷新，ctrl+R刷新了，但没有，急死了
音频、视频等文件格式（.ts、.meta）及其认识
Shuuc: meta 文件并不能打开
补码：统一加减运算
做而论道_CS: 虽然，计算机使用的是：二进制数。但是，进行算术计算时，二进制数也是数，与十进制是雷同的。二进制数，也是数，它也是完全正常的数字。并非是什么乱七八糟的：原码反码补码。千万不要听信那些砖家胡讲！就说四位二进制数吧。四位数范围是：0000 ~ 1111。相当于十进制：0 ~ 15。出现进位，即：2^4 = 16。这些数中，既没有小数点，也没有符号位。它们，都是正整数！计算机砖家就给它们编造了一个名称：无符号数。其实，这就是【忽悠】！计算机中有个加法器，其运算规则是：逢二进一。找两个无符号数相加，列竖式如下：　　　0 1 0 1　= 5 　　＋1 1 1 1　= 15 －－－－－－－－－－－进 1、 0 1 0 0　= 16 + 4 = 20 这就是 “无符号数” 的加法：　　5 + 15 = 16 + 4 = 20。计算完全正确！－－－－－－－－－－－－－－－－－但是，如果你忽略了进位呢？（或者说：故意舍弃了进位。）这就少算了 16 ！那么就是：5 + 15－16 = 5－1 = 4。此时的＋15，就相当于－1 了！为什么是－1 ？因为你：舍弃了进位，少算了 16。所以有：＋15－16 = －1。加法的竖式，依然如下：　　　0 1 0 1　= 5 　　＋1 1 1 1　= 15 （=－1）－－－－－－－－－－－略掉、0 1 0 0　= 4 但是，此时，这可就是【减法运算】了。你看吧，本来是两个 “无符号数” 相加，丢了进位，就变成了 “有符号数” 相减！由此可知，所谓的 “有符号数、无符号数、符号位”，就是瞎掰！二进制数，也就是普通的数字！只是因为： “弄丢了进位”，才会出来 “负数” 和 “减法”。
matplotlib tricks（关闭坐标刻度、坐标轴不可见）
qq_37404964: set_xticklabels([])是可以的

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

五道口纳什 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。