label smoothing 标签平滑

最新推荐文章于 2023-10-20 18:33:33 发布

坚硬果壳_

最新推荐文章于 2023-10-20 18:33:33 发布

阅读量461

点赞数

分类专栏：深度学习优化方法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38156104/article/details/108136803

版权

深度学习同时被 2 个专栏收录

21 篇文章 2 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

Label smoothing Regularization(LSR)是深度学习中的一种优化方法，即“标签平滑归一化”，它的优化对象是Label。可以理解为给样本标签引入一定的噪声，避免模型过拟合。

对于分类问题，尤其是多类别分类问题中，常常把类别向量表示成one-hot vector，也叫做硬目标。

简单地说，就是对于多分类向量，计算机中往往用[0, 1, 3]等此类离散的、随机的而非有序(连续)的向量表示，而one-hot vector 对应的向量便可表示为[0, 1, 0]，即对于长度为n 的数组，只有一个元素是1，其余都为0。因此表征我们已知样本属于某一类别的概率是为1的确定事件，属于其他类别的概率则均为0。

one-hot 带来的问题：

对于损失函数，需要用预测概率去拟合真实概率，拟合one-hot的真实概率函数会带来两个问题：

无法保证模型的泛化能力，容易造成过拟合；
全概率和0概率鼓励所属类别和其他类别之间的权重差距尽可能加大，而由梯度有界可知，这种情况很难adapt。会造成模型过于相信预测的类别。

使用下面的 label smoothing 可以缓解这个问题：

假设样本以 $\epsilon$ 的概率为其它类，平滑后的标签为： $\widetilde{y}=[\frac{\epsilon }{K-1},\frac{\epsilon }{K-1},1-\epsilon\cdots,\frac{\epsilon }{K-1} ]$ ,K为标签数量，这种标签可以看作软目标。

标签平滑可以避免模型的输出过拟合到硬目标，并且一般不会损害模型的分类能力。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
label smoothing 标签平滑

Label smoothing Regularization(LSR)是深度学习中的一种优化方法，即“标签平滑归一化”，它的优化对象是Label。可以理解为给样本标签引入一定的噪声，避免模型过拟合。对于分类问题，尤其是多类别分类问题中，常常把类别向量表示成one-hot vector，也叫做硬目标。简单地说，就是对于多分类向量，计算机中往往用[0, 1, 3]等此类离散的、随机的而非有序(连续)的向量表示，而one-hot vector对应的向量便可表示为[0, 1, 0]，即对于长度为n 的数.
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。