label smooth的pytorch实现以及其公式推导（虽然短但是细）

最新推荐文章于 2023-03-22 16:53:03 发布

qiny1012

最新推荐文章于 2023-03-22 16:53:03 发布

阅读量2.2k

点赞数 10

文章标签： pytorch

本文链接：https://blog.csdn.net/qq_27182145/article/details/108509227

版权

标签平滑：label smooth

标签平滑是一种正则化手段，目的为了解决onehot编码的缺陷，减少过拟合问题。在各种竞赛中广泛使用，涨点神器。

假设:
预测的结果为 $y_{pred}$ , 真实结果为 $y_{true}$ ,类别数量为 $* * N$ ，标签平滑因子为 $\epsilon，即epsilon$

标签平滑即在 $y_{true}$ 的one-hot编码中进行处理。
$y_{new_true} = (1 - \epsilon) * y_{true} + \epsilon / N \\ \{1, 0 ,0\} => \{\epsilon = 0.1\} = > \{0.933,0.033,0.033\} \\ \{0, 1 ,0\} => \{\epsilon = 0.5\} = > \{0.16,0.66,0.16\}$
在多分类中，往往采用交叉熵作为损失函数，如何将标签平滑和交叉熵进行结合，下面我们进行推导：
$L_{cross\_entroy} = -\sum y_{true}~log~y_{pred} \\ L_{cross\_entroy\_labelsmooth} = -\sum ((1 - \epsilon) * y_{true} + \epsilon / N)~log~y_{pred} \\ = -\sum (1 - \epsilon) * y_{true}~log~y_{pred} - \sum \epsilon / N~log~y_{pred}\\ =-(1 - \epsilon) \sum y_{true}~log~y_{pred} - \epsilon / N\sum~log~y_{pred} \\ = (1 - \epsilon) * L_{cross\_entroy} - \epsilon / N\sum~log~y_{pred}$
根据公式的最后一行，我们知道使用标签平滑的交叉熵损失，只需要在原来的损失函数上乘上一个因子 $(1-\epsilon)$ ，并减去因子 $(\epsilon /N)$ 和预测结果对数之和的乘积。

代码：https://github.com/lonePatient/label_smoothing_pytorch/blob/master/lsr.py（来自网上）

import torch.nn as nn
import torch.nn.functional as F

## eps 表示标签平滑因子
class LabelSmoothingCrossEntropy(nn.Module):
    def __init__(self, eps=0.1, reduction='mean'):
        super(LabelSmoothingCrossEntropy, self).__init__()
        self.eps = eps
        self.reduction = reduction

    def forward(self, output, target):
        c = output.size()[-1]
        log_preds = F.log_softmax(output, dim=-1)
        if self.reduction=='sum':
            loss = -log_preds.sum()
        else:
            loss = -log_preds.sum(dim=-1)
            if self.reduction=='mean':
                loss = loss.mean()
        return loss*self.eps/c + (1-self.eps) * F.nll_loss(log_preds, target, reduction=self.reduction)

qiny1012

关注

10
点赞
踩
21

收藏

觉得还不错? 一键收藏
4
评论
label smooth的pytorch实现以及其公式推导（虽然短但是细）

标签平滑：label smooth目的为了解决onehot编码的缺陷，（过拟合问题）假设: 预测的结果为 ypredy_{pred}ypred, 真实结果为ytruey_{true}ytrue,类别数量为NNN标签平滑即在ytruey_{true}ytrue的one-hot编码中进行处理。ynewtrue=(1−ϵ)∗ytrue+ϵ/N{1,0,0}=>{ϵ=0.1}=>{0.933,0.033,0.033}{0,1,0}=>{ϵ=0.5}=>{0.16,0.66,0.
复制链接

扫一扫