Pytorch中的损失函数

最新推荐文章于 2024-01-18 10:35:44 发布

NNU_CJ

最新推荐文章于 2024-01-18 10:35:44 发布

阅读量1.6k

点赞数 1

分类专栏： Pytorch学习系列

本文链接：https://blog.csdn.net/NNU_CJ/article/details/109233420

版权

本文详细介绍了Pytorch中各种损失函数的原理和使用，包括CrossEntropyLoss、NLLLoss、BCELoss、BCEWithLogitsLoss、L1Loss、MSELoss、SmoothL1Loss、PoissonNLLLoss、KLDivLoss、MarginRankingLoss、MultiLabelMarginLoss、SoftMarginLoss、MultiLabelSoftMarginLoss、MultiMarginLoss、TripletMarginLoss以及CosineEmbeddingLoss和CTCLoss，适合深度学习开发者参考。

摘要由CSDN通过智能技术生成

pytorch中的损失函数
- 0.前言
- 1.Loss Function

pytorch中的损失函数

0.前言

深度学习中优化方法直接作用的对象是损失函数。损失函数表示了预测值与真实值之间的差距程度，一个最优化问题的目标是将损失函数最小化，针对分类问题，直观的表现就是.分类的正确样本越多越好；回归问题中，直观的表现就是预测值与实际值的误差越小越好。

损失函数(Loss Function):
$Loss=f(y^,,y)$
代价函数(Cost Fuction):
$Cost=\frac{1}{N}\sum_{i=0}^{N}f(y_{i}^, y_{i})$
Pytorch中nn模块下提供了多种可以直接使用的损失函数，如交叉熵、均方误差等，针对不同的问题，可以直接调用现有的损失函数，常用的损失函数以及适合的问题如下表。

类	损失函数名称	适应问题
torch.nn.L1Loss()	平均绝对值损失	回归
torch.nn.MSELoss()	均方误差损失	回归
torch.nn.CrossEntropyLoss()	交叉熵损失	多分类
torch.nn.CTCLoss()
torch.nn.NLLLoss()	负数对数似然函数损失	多分类
torch.nn.KLDivLoss()	KL散度损失	回归
torch.nn.BCELoss()	二分类交叉熵损失	二分类
torch.nn.MarginRankingLoss	评价相似度损失
torch.nn.MultiLabelMarginLoss	多标签分类损失	多标签分类
torch.nn.SmoothL1Loss	平滑L1损失	回归
torch.nn.SoftMarginLoss	多标签二分类损失	多标签二分类

接下来对部分损失函数，以及pytorch框架下的api进行整理说明。

1.Loss Function

1.1 _Loss基类

在pytorch中nn模块下定义的loss的源码类,分别定义LOSS的类以及的带有权重系数的类。

from .module import Module
from .. import functional as F
from .. import _reduction as _Reduction

from torch import Tensor
from typing import Optional


class _Loss(Module):
    reduction: str

    def __init__(self, size_average=None, reduce=None, reduction: str = 'mean') -> None:
        super(_Loss, self).__init__()
        if size_average is not None or reduce is not None:
            self.reduction = _Reduction.legacy_get_string(size_average, reduce)
        else:
            self.reduction = reduction


class _WeightedLoss(_Loss):
    def __init__(self, weight: Optional[Tensor] = None, size_average=None, reduce=None, reduction: str = 'mean') -> None:
        super(_WeightedLoss, self).__init__(size_average, reduce, reduction)
        self.register_buffer('weight', weight)

1.2 nn.CrossEntropyLoss

1.2.1 有关交叉熵、信息熵、相对熵的基本概念：

使用交叉熵是为衡量两个数据概率分布差异，所以交叉熵制越低两个值相差越相似。
$\text{交叉熵 = 信息熵 + 相对熵}$
1.交叉熵
$-\sum_{i=1}^NP(x_{i})logQ(x_{i})$
2.自信息，衡量单个事件的不确定性
$l (x) = - l o g [p (x)]$
3.熵（信息熵），简答讲事件的越不确定性越大，熵的值越大，自信的期望
$E_{x~p}[I(x)] = -\sum_{i}^NP(x_{i})logP(x_{i})$
4.相对熵（KL散度），衡量两个分布之间的差异，不具备对称性。
$D_{KL}(P,Q) = E_{x~p}[log\frac{P(x)}{Q(x)}]\\=E_{x-p}[logP(x)-logQ(x)]\\=\sum_{i=1}^NP(x_{i})[logP(x_{i})-logQ(x_{i})]\\=\sum_{i=1}^NP(x_{i})logP(x_{i})-\sum_{i=1}^NP(x_{i})logQ(x_{i})\\=H(P,Q)-H(P)$