相对熵（KL散度）计算过程

手撕机

已于 2022-10-24 20:16:13 修改

阅读量6.1w

点赞数 22

分类专栏：笔记文章标签： KL散度相对熵 1024程序员节

于 2018-03-29 00:59:41 首次发布

原创文章，未经授权请勿转载。

本文链接：https://blog.csdn.net/guolindonggld/article/details/79736508

版权

笔记专栏收录该内容

33 篇文章 4 订阅

订阅专栏

KL散度（Kullback-Leibler Divergence）也叫做相对熵，用于度量两个概率分布之间的差异程度。

离散型

$D_{KL}(P \parallel Q)= \sum_{i=1}^{n}P_i log(\frac{P_i}{Q_i})$

比如随机变量 $\sim P$ 取值为 $1, 2, 3$ 时的概率分别为 $[0.2, 0.4, 0.4]$ ，随机变量 $\sim Q$ 取值为 $1, 2, 3$ 时的概率分别为 $[0.4, 0.2, 0.4]$ ，则：

$\begin{aligned} D(P \parallel Q) & =0.2 \times log(\frac{0.2}{0.4}) + 0.4 \times log(\frac{0.4}{0.2}) + 0.4 \times log(\frac{0.4}{0.4}) \\ & =0.2 \times -0.69 + 0.4 \times 0.69 + 0.4\times0 \\ & = 0.138 \end{aligned}$

Python代码实现，离散型KL散度可通过SciPy进行计算：

from scipy import stats

P = [0.2, 0.4, 0.4]
Q = [0.4, 0.2, 0.4]
stats.entropy(P,Q) # 0.13862943611198905

P = [0.2, 0.4, 0.4]
Q = [0.5, 0.1, 0.4]
stats.entropy(P,Q) # 0.3712595980731252

P = [0.2, 0.4, 0.4]
Q = [0.3, 0.3, 0.4]
stats.entropy(P,Q) # 0.03397980735907956

KL散度的性质：

1、 $D_{KL}(P \parallel Q) \geq 0$ ，即非负性。
2、 $D_{KL}(P \parallel Q) \ne D_{KL}(Q \parallel P)$ ，即不对称性。

连续型

$D_{KL}(P \parallel Q) =\int_{-\infty }^{+ \infty} p(x) log \frac{p(x)}{q(x)} dx$

（没怎么用到，后面再补吧）

关注

22
点赞
踩
57

收藏

觉得还不错? 一键收藏
打赏
15
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

手撕机 CSDN认证博客专家 CSDN认证企业博客

码龄12年

人工智能领域新星创作者

135: 原创

3147: 周排名

39万+: 总排名

181万+: 访问

: 等级

6459: 积分

2万+: 粉丝

844: 获赞

306: 评论

3706: 收藏

私信

关注

热门文章

分类专栏

Linux 1篇
Spark 5篇
CentOS 1篇
Keras 1篇
TensorFlow 2.0 2篇
Python 1篇
PyQt5 4篇
Java
推荐系统 4篇
评价指标 2篇
深度学习 1篇
PMML 1篇
基础算法 1篇
GraphX 1篇
运筹 1篇
机器学习 5篇
Hive 1篇
C++
TensorFlow 1.0 11篇
计算机网络
笔记 33篇

最新评论

搜索推荐评价指标Precision@k、Recall@k、F1@k、NDCG@k
m0_57914665: 在信息检索和推荐系统中，`TP@k`（True Positives @ k）和`FN@k`（False Negatives @ k）是评估推荐系统性能时使用的术语，特别是在二分类或多分类任务中。它们分别代表在前k个推荐结果中真正的正例数量（真正相关或用户真正感兴趣的项目数量）和未被推荐但实际相关的项目数量。 - **TP@k (True Positives @ k)**: 在推荐系统的前k个推荐结果中，实际被正确推荐的相关项目的数量。这些是系统正确识别并推荐给用户的项目。 - **FN@k (False Negatives @ k)**: 在推荐系统的前k个推荐结果之外，但实际上相关的项目数量。这些是系统未能推荐给用户的相关项目。 ### 示例假设在一个推荐系统中，我们有一个用户的测试集包含10部相关电影（用户会喜欢的电影）。系统推荐了10部电影作为推荐列表（k=10）。 - 如果在这10部推荐电影中有7部确实是用户会喜欢的，那么 `TP@10` 就是7。 - 假设测试集中还有3部相关电影没有被推荐，那么 `FN@10` 就是3。 ### 公式 - **TP@k**: \[ \text{TP@k} = \sum_{i=1}^{k} \mathbf{1}_{\{\text{第 } i \text{ 个推荐项目是相关的}\}} \] 这里 \(\mathbf{1}_{\{\cdot\}}\) 是指示函数，如果条件满足则为1，否则为0。 - **FN@k**: \[ \text{FN@k} = \sum_{\text{所有相关项目}} \mathbf{1}_{\{\text{项目不在前 } k \text{ 个推荐中的}\}} \] ### 使用场景 - **TP@k** 被用于计算精确率 (`Precision@k`) 和 F1 分数 (`F1@k`)。 - **FN@k** 被用于计算召回率 (`Recall@k`) 和 F1 分数。通过计算 TP@k 和 FN@k，我们可以进一步分析推荐系统的性能，并据此调整推荐算法以优化用户体验。
搜索推荐评价指标Precision@k、Recall@k、F1@k、NDCG@k
道与计算机编程: 作者对搜索结果评价指标的理解是不是有点点问题，以Precision@3为例，2/3的结果完全不能代表任何情况下搜索任务的精确度，你能明白我的意思么？因为你的这种计算方法只考虑了单次搜索，对评价整体任务看起来并没有意义。欢迎讨论
[TensorFlow笔记] 获取Tensor的维度（tf.shape(x)、x.shape和x.get_shape()的区别）
书店莫得: 解决问题，感谢博主分享，写的很清晰明了。赞
机器翻译评价指标之BLEU详细计算过程
HIT_胡森林: 应该是对结果扩大了100倍
解码之Beam Search算法
@__Chao - L: 有没有实现代码？

最新文章

目录

评论 15

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

手撕机 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。