label smoothing 标签平滑

Label smoothing Regularization(LSR)是深度学习中的一种优化方法即“标签平滑归一化”,它的优化对象是Label。可以理解为给样本标签引入一定的噪声,避免模型过拟合。

对于分类问题,尤其是多类别分类问题中,常常把类别向量表示成one-hot vector,也叫做硬目标。

简单地说,就是对于多分类向量,计算机中往往用[0, 1, 3]等此类离散的、随机的而非有序(连续)的向量表示,而one-hot vector 对应的向量便可表示为[0, 1, 0],即对于长度为n 的数组,只有一个元素是1,其余都为0。因此表征我们已知样本属于某一类别的概率是为1的确定事件,属于其他类别的概率则均为0。

one-hot 带来的问题:

对于损失函数,需要用预测概率去拟合真实概率,拟合one-hot的真实概率函数会带来两个问题:

  • 无法保证模型的泛化能力,容易造成过拟合;
  • 全概率和0概率鼓励所属类别和其他类别之间的权重差距尽可能加大,而由梯度有界可知,这种情况很难adapt。会造成模型过于相信预测的类别。

使用下面的 label smoothing 可以缓解这个问题:

假设样本以\epsilon的概率为其它类,平滑后的标签为:\widetilde{y}=[\frac{\epsilon }{K-1},\frac{\epsilon }{K-1},1-\epsilon\cdots,\frac{\epsilon }{K-1} ],K为标签数量,这种标签可以看作软目标。

标签平滑可以避免模型的输出过拟合到硬目标,并且一般不会损害模型的分类能力。

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值