ptorch中的nn.KLDivLoss：KL散度损失

一本糊涂张～

于 2024-03-23 20:01:58 发布

阅读量709

点赞数 18

分类专栏：深度学习文章标签： pytorch

本文链接：https://blog.csdn.net/zly_always_be/article/details/136973741

版权

深度学习专栏收录该内容

22 篇文章 1 订阅

订阅专栏

KL散度被广泛应用于度量分布之间的差异，其形式为： $D_{KL}(P||Q)=\sum_{i=1}^{N}p_ilog\frac{p_i}{q_i}=\sum_{i=1}^{N}p_i*(logp_i-logq_i)$ pytorch中给出了两种不同的方法用于计算KL散度，分别是torch.nn.functional.kl_div()和torch.nn.KLDivLoss()，两者计算效果类似，区别无非是直接计算和作为损失函数类，我们重点看torch.nn.KLDivLoss()，在深度学习中是一个很常见的损失。官方文档地址为：

nn.KLDivLoss:https://pytorch.org/docs/stable/generated/torch.nn.KLDivLoss.html#torch.nn.KLDivLoss>

函数定义：

torch.nn.KLDivLoss(size_average=None, reduce=None, reduction='mean', log_target=False)

其中，size_average与reduce参数已被弃用，具体功能由参数reduction代替；reduction：指定损失输出的形式，有四种选择：none|mean|batchmean|sum。none：损失不做任何处理，直接输出一个数组；mean：将得到的损失求平均值再输出；batchmean：将输出的总和除以batchsize；sum：将得到的损失求和再输出；log_target：指定是否对输入的target使用log操作。
在使用上，nn.KLDivLoss和交叉熵损失是不同的，对于pytorch中的交叉熵损失torch.nn.CrossEntropyLoss，我们给进的网络预测结果不需要进行softmax处理，给进的labels可以仅仅是一个label的list，函数中内置了对标签进行的ont-hot操作，而在nn.KLDivLoss中并没有这种操作，因此，对于nn.KLDivLoss输入的两个分布input和target，我们首先要对其进行softmax操作。此外，当log_target参数设定为False时，计算方式为： $P * (l o g P - Q)$ ，这与定义式的结果不同，因此，还需要对input取对数操作（在官方文档中也有提及，建议将input映射到对数空间，防止数值下溢）,一个示例代码为：

import torch
import torch.nn.Functional as F
torch.nn.KLDivLoss(F.softmax(Q).log(), F.softmax(P), reduction='mean')

一本糊涂张～

关注

18
点赞
踩
10

收藏

觉得还不错? 一键收藏
打赏
0
评论
ptorch中的nn.KLDivLoss：KL散度损失

ptorch中的nn.KLDivLoss：KL散度损失
复制链接

扫一扫

专栏目录

ptorch中的nn.KLDivLoss：KL散度损失

“相关推荐”对你有帮助么？