2020-11-11

最新推荐文章于 2024-07-10 22:17:05 发布

林木木木木木木

最新推荐文章于 2024-07-10 22:17:05 发布

阅读量95

点赞数

分类专栏： pytorch 文章标签：深度学习 python

本文链接：https://blog.csdn.net/qq_42142597/article/details/109625107

版权

pytorch 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

pytorch | labelSmooth

- labelSmooth
- pytorch实现

labelSmooth

labelSmooth也称为标签平滑: 提高模型的泛化能力，对于未知域任务，分类任务，可以提高精度。主要解决噪音问题：例如在如果具有噪音的标签参与训练，就会造成过拟合的情况。
$\begin{array}{l} \text {Loss}=-\sum_{i=1}^{K} p_{i} \log q_{i} \\ p_{i}=\left\{\begin{array}{l} 1, \text {if }(i=y) \\ 0, \text {if }(i \neq y) \end{array}\right. \end{array}$
上式是交叉熵函数损失，为了达到最好的拟合效果，最优的预测概率分布为：
$Z_{i}=\left\{\begin{array}{l} +\infty, \text {if }(i=y) \\ 0, \text {if }(i \neq y) \end{array}\right.$
改进之后，更新后的分布就相当于往真实分布中加入了噪声，为了便于计算，该噪声服从简单的均匀分布：
$\text { Loss }=-\sum_{i=1}^{K} p_{i} \log q_{i} \longmapsto \operatorname{Loss}_{i}=\left\{\begin{array}{l} (1-\varepsilon)^{*} \operatorname{Loss}, i f(i=y) \\ \varepsilon^{*} \operatorname{Loss}, \text {if }(i \neq y) \end{array}\right.$
$Z_{i}=\left\{\begin{array}{l} +\infty, i f(i=y) \\ 0, i f(i \neq y) \end{array} \quad \longrightarrow \quad Z_{i}=\left\{\begin{array}{l} \log \frac{(k-1)(1-\varepsilon)}{\varepsilon+\alpha}, i f(i=y) \\ \alpha, i f(i \neq y) \end{array}\right.\right.$
阿尔法可以是任意实数，最终通过抑制正负样本输出差值，使得网络能有更好的泛化能力。

pytorch实现

code链接

class LabelSmoothingCrossEntropy(nn.Module):
    def __init__(self, eps=0.1, reduction='mean'):
        super(LabelSmoothingCrossEntropy, self).__init__()
        self.eps = eps
        self.reduction = reduction

    def forward(self, output, target):
        c = output.size()[-1]
        log_preds = F.log_softmax(output, dim=-1)
        if self.reduction=='sum':
            loss = -log_preds.sum()
        else:
            loss = -log_preds.sum(dim=-1)
            if self.reduction=='mean':
                loss = loss.mean()
        return loss*self.eps/c + (1-self.eps) * F.nll_loss(log_preds, target, reduction=self.reduction)

林木木木木木木

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
2020-11-11

pytorch | labelSmoothlabelSmoothpytorch实现labelSmoothlabelSmooth也称为标签平滑: 提高模型的泛化能力，对于未知域任务，分类任务，可以提高精度。主要解决噪音问题：例如在如果具有噪音的标签参与训练，就会造成过拟合的情况。Loss=−∑i=1Kpilog⁡qipi={1,if (i=y)0,if (i≠y)\begin{array}{l}\text {Loss}=-\sum_{i=1}^{K} p_{i} \log q_{
复制链接

扫一扫