探索标签平滑：何时结合噪声标签？

曹俐莉

于 2024-06-26 09:55:18 发布

阅读量386

点赞数 5

本文链接：https://blog.csdn.net/gitblog_00098/article/details/139980857

版权

探索标签平滑：何时结合噪声标签？

To Smooth or Not? When Label Smoothing Meets Noisy Labels 是一个由ICML 2022（口头报告）接受的官方PyTorch实现项目，它提供了一种通用的标签平滑（Generalized Label Smoothing, GLS）插件实现，旨在处理有噪声的分类任务。

项目介绍

该项目的核心是一个简洁的PyTorch函数 loss_gls，用于计算带有平滑率（smooth_rate）的GLS损失。它允许用户在训练过程中调整模型对标签的信心，从而更好地适应不同类型的噪声。通过简单的代码导入和调用，你可以轻松地将GLS集成到你的现有网络中。

import torch
import torch.nn.functional as F

def loss_gls(logits, labels, smooth_rate=0.1):
    ...

项目技术分析

loss_gls 函数巧妙地结合了传统的交叉熵损失（Vanilla Loss）和平滑损失，以适应不同的噪声环境。它通过以下公式定义：

Loss = confidence * Vanilla Loss + smooth_rate * GLS Loss

其中，confidence 控制模型对原始标签的信任程度，而 smooth_rate 可正可负，用于调整平滑效应的强度。

应用场景

项目提供了针对合成噪声CIFAR数据集的实验，说明了直接训练和预热（warm-up）策略如何影响GLS的效果。此外，它也兼容CIFAR-N Github Page提供的真实世界噪声数据集，使得研究者可以评估其性能并应用于更广泛的现实问题。

直接训练：对于低噪声率的情况，可以直接应用GLS进行训练。
预热策略：当噪声率较高时，先使用CE损失预热模型，然后再引入GLS，可以取得更好的效果。

项目特点

易用性：GLS作为PyTorch的一个简单插件，易于理解和集成。
普适性：适用于各种噪声模型，包括对称和非对称噪声。
灵活性：用户可以通过调整 smooth_rate 和其他参数，自定义噪声处理策略。
实验丰富：提供的实验展示了在不同噪声设置下的性能，为实践者提供了有价值的参考。

如果你在处理噪声标签的数据集上遇到挑战，或者想要探索标签平滑的新方法，这个项目绝对值得尝试。记得在使用时引用相关论文哦！

@inproceedings{Wei2022ToSO,
  title={To Smooth or Not? When Label Smoothing Meets Noisy Labels},
  author={Jiaheng Wei and Hangyu Liu and Tongliang Liu and Gang Niu and Yang Liu},
  booktitle={ICML},
  year={2022}
}

现在就加入这个项目，发掘更多深度学习与噪声标签处理的奥秘吧！

曹俐莉

关注

5
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
0
评论
探索标签平滑：何时结合噪声标签？

探索标签平滑：何时结合噪声标签？To Smooth or Not? When Label Smoothing Meets Noisy Labels 是一个由ICML 2022（口头报告）接受的官方PyTorch实现项目，它提供了一种通用的标签平滑（Generalized Label Smoothing, GLS）插件实现，旨在处理有噪声的分类任务。项目地址:https://gitcode.co...
复制链接

扫一扫