Label Smoothing

最新推荐文章于 2024-08-07 19:42:51 发布

有点方

最新推荐文章于 2024-08-07 19:42:51 发布

阅读量224

点赞数

分类专栏： pytorch 损失函数计算机视觉文章标签：深度学习 pytorch 人工智能

本文链接：https://blog.csdn.net/qq_35447659/article/details/107818462

版权

18 篇文章 1 订阅

订阅专栏

16 篇文章 0 订阅

订阅专栏

4 篇文章 0 订阅

订阅专栏

在分类任务中，我们通常对类别标签的编码使用[0,1,2,…]这种形式。在深度学习中，通常在全连接层的最后一层，加入一个softmax来计算输入数据属于每个类别的概率，并把概率最高的作为这个类别的输入，然后使用交叉熵作为损失函数。

这会导致模型对正确分类的情况奖励最大，错误分类惩罚最大。如果训练数据能覆盖所有情况，或者是完全正确，那么这种方式没有问题。但事实上，这不可能。所以这种方式可能会带来泛化能力差的问题，即过拟合。

按softmax交叉熵优化时，针对这个样本而言，会让0.721越来越接近于1，因为这样会减少loss，但是这有可能造成过拟合。可以这样理解，如果0.721已经接近于1了，那么网络会对该样本十分“关注”，也就是过拟合。我们可以通过标签平滑的方式解决。

这个label_smoothing的值假设为ϵ，那么就是说，原来分类准确的时候，p=1，不准确为p=0，现在变成了p=1−ϵ和ϵ，也就是说对分类准确做了一点惩罚。

主要代码：

smoothed_target = self._smooth_label(target, x.size(1), self.e)
x = self.log_softmax(x)
loss = torch.sum(- x * smoothed_target, dim=1)

github:

关注

专栏目录