Pytorch之KLDivLoss

逸彬

已于 2022-07-14 13:47:39 修改

阅读量2.7k

点赞数 3

分类专栏：笔记文章标签： pytorch python 机器学习

于 2022-07-14 13:37:02 首次发布

本文链接：https://blog.csdn.net/king_project/article/details/125782232

版权

笔记专栏收录该内容

7 篇文章 0 订阅

订阅专栏

理论基础

KL散度：衡量两个概率分布之间的相似性，其值越小，概率分布越接近。公式表达如下。

$\begin{aligned} D_{K L}(P \| Q) & =\sum_{i=1}^{N}\left[p\left(x_{i}\right) \log p\left(x_{i}\right)-p\left(x_{i}\right) \log q\left(x_{i}\right)\right] \\ & = \sum_{i=1}^{N}\left[p\left(x_{i}\right) \frac{\log p\left(x_{i}\right)}{\log q\left(x_{i}\right)} \right] \end{aligned}$

注：对于两个概率分布 $P$ 、 $Q$ ， $P$ 为真实事件的概率分布， $Q$ 为随机事件拟合出来的该事件的概率分布，即 $D_{K L}(P \| Q)$ 表示使用 $P$ 来拟合 $Q$ ，或者说使用 $Q$ 来指导 $P$ 。

实现

import torch
import torch.nn as nn
import torch.nn.functional as F

# 预测值
input = torch.tensor([0.7, .1, .2], requires_grad=True)  # dim=0 每一行为一个样本

# 真实值
target = torch.tensor([.2, .5, .3])

# 计算KL散度
# 方式1
kl_loss = nn.KLDivLoss(reduction="batchmean")
output = kl_loss(F.log_softmax(input, dim=0), F.softmax(target, dim=0))
print(output)

# 方式2
print(F.kl_div(F.log_softmax(input, dim=0), F.softmax(target, dim=0), reduction="batchmean"))

# 方式3
my_kl_loss = F.softmax(target, dim=0) * (torch.log(F.softmax(target, dim=0)) - F.log_softmax(input, dim=0))
my_kl_loss = my_kl_loss.mean()
print(my_kl_loss)

# 方式4
my_kl_loss2 = F.softmax(target, dim=0) * (F.log_softmax(target, dim=0) - F.log_softmax(input, dim=0))
my_kl_loss2 = my_kl_loss2.mean()
print(my_kl_loss2)

# ----------------输出--------------------
# tensor(0.0239, grad_fn=<DivBackward0>)
# tensor(0.0239, grad_fn=<MeanBackward0>)
# tensor(0.0239, grad_fn=<MeanBackward0>)
# tensor(0.0239, grad_fn=<DivBackward0>)
# ----------------------------------------