pytorch中的kl divergence计算问题

最新推荐文章于 2024-06-16 10:45:52 发布

Systemd

最新推荐文章于 2024-06-16 10:45:52 发布

阅读量1.9w

点赞数 21

分类专栏： pytorch 文章标签： pytorch kl divergence

本文链接：https://blog.csdn.net/wwyy2018/article/details/101599862

版权

pytorch 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

偶然从pytorch讨论论坛中看到的一个问题，KL divergence different results from tf，kl divergence 在TensorFlow中和pytorch中计算结果不同，平时没有注意到，记录下

一篇关于KL散度、JS散度以及交叉熵对比的文章

kl divergence 介绍

KL散度( Kullback–Leibler divergence)，又称相对熵，是描述两个概率分布 P 和 Q 差异的一种方法。计算公式:
$D(P||Q)=\sum{p_i~log_2\frac{p_i}{q_i}}$
可以发现，P 和 Q 中元素的个数不用相等，只需要两个分布中的离散元素一致。
举个简单例子：
两个离散分布分布分别为 P 和 Q
P 的分布为：{1，1，2，2，3}
Q 的分布为：{1，1，1，1，1，2，3，3，3，3}
我们发现，虽然两个分布中元素个数不相同，P 的元素个数为 5，Q 的元素个数为 10。但里面的元素都有 “1”，“2”，“3” 这三个元素。
当 x = 1时，在 P 分布中，“1” 这个元素的个数为 2，故 P(x = 1) = 2/5 = 0.4，在 Q 分布中，“1” 这个元素的个数为 5，故 Q(x = 1) = 5/10 = 0.5
同理，
当 x = 2 时，P(x = 2) = 2/5 = 0.4 ，Q(x = 2) = 1/10 = 0.1
当 x = 3 时，P(x = 3) = 1/5 = 0.2 ，Q(x = 3) = 4/10 = 0.4
把上述概率带入公式：
$D(P||Q)=0.4~log_2\frac{0.4}{0.5}+0.4~log_2\frac{0.4}{0.1}+0.2~log_2\frac{0.2}{0.4}=0.47$
至此，就计算完成了两个离散变量分布的KL散度。

pytorch 中的 kl_div 函数

pytorch中有用于计算kl散度的函数 kl_div

torch.nn.functional.kl_div(input, target, size_average=None, reduce=None, reduction='mean')

在这里插入图片描述

计算 D （p||q）

1、不用这个函数的计算结果为：
在这里插入图片描述
与手算结果相同
2、使用函数：（这是计算正确的，结果有差异是因为pytorch这个函数中默认的是以e为底）

注意：
1、函数中的 p q 位置相反(也就是想要计算D(p||q)，要写成kl_div（q.log（），p）的形式)，而且q要先取 log
2、reduction 是选择对各部分结果做什么操作，默认为取平均数，这里选择求和

好别扭的用法，不知道为啥官方把它设计成这样

Systemd

关注

21
点赞
踩
40

收藏

觉得还不错? 一键收藏
打赏
3
评论
pytorch中的kl divergence计算问题

偶然从pytorch讨论论坛中看到的一个问题，KL divergence different results from tf，kl divergence 在TensorFlow中和pytorch中计算结果不同，平时没有注意到，记录下kl divergence 介绍KL散度( Kullback–Leibler divergence)，又称相对熵，是描述两个概率分布 P 和 Q 差异的一种方法。计...
复制链接

扫一扫