神经网络训练Trick-Label Smoothing(标签平滑)

最新推荐文章于 2024-03-14 13:39:06 发布

v-space

最新推荐文章于 2024-03-14 13:39:06 发布

阅读量1.1k

点赞数

分类专栏：深度学习神经网络训练Trick 文章标签：深度学习神经网络算法 python 机器学习

本文链接：https://blog.csdn.net/weixin_42069606/article/details/105009293

版权

深度学习同时被 2 个专栏收录

9 篇文章 1 订阅

订阅专栏

神经网络训练Trick

2 篇文章 0 订阅

订阅专栏

Label Smoothing由(Christian Szeged et al., 2015)是为了防止训练过拟合而提出。

提出原因：

one-hot encoding(独热编码)：
在分类问题中，常常通过softmax将输出向量转化为独热编码，即正类为1，其他为0。
对于N分类问题，每一类对应一个N维向量:

#label及其所对应的one-hot编码对应如下:
label=[0,1,2,3,4,5,6]
one_hot_encode = [[1,0,0,0,0,0,0],
                 [0,1,0,0,0,0,0],
                 [0,0,1,0,0,0,0],
                 [0,0,0,1,0,0,0],
                 [0,0,0,0,1,0,0],
                 [0,0,0,0,0,1,0],
                 [0,0,0,0,0,0,1]]

缺点：
如交叉熵损失函数
$loss=-\displaystyle\sum_{k=1}^Kq(k/x)\log(p(k/x))$
若分类越准确，loss值越接近0，否则越趋近负无穷。然而我们的标注不一定是完全准确的，因此如果使用独热编码会导致使用交叉熵学习的目标函数不一定达到最优，反而可能过拟合。

LabelSmoothing:

真实概率分布变化：
在这里插入图片描述
$\epsilon$ 常取0.1

def label_smoothing(inputs, eps=0.1):
  	K = inputs.size(-1)    # number of class
  	return (1-eps) * inputs + eps / (K-1)

 #one-hot编码对应改为：
[[0.9998,0.0002,0.0002,0.0002,0.0002,0.0002,0.0002],
[0.0002,0.9998,0.0002,0.0002,0.0002,0.0002,0.0002],
[0.0002,0.0002,0.9998,0.0002,0.0002,0.0002,0.0002],
[0.0002,0.0002,0.0002,0.9998,0.0002,0.0002,0.0002],
[0.0002,0.0002,0.0002,0.0002,0.9998,0.0002,0.0002],
[0.0002,0.0002,0.0002,0.0002,0.0002,0.9998,0.0002],
[0.0002,0.0002,0.0002,0.0002,0.0002,0.0002,0.9998]]

参考：
标签平滑Label Smoothing [CSDN]
Label smooth [CSDN]
机器学习中用来防止过拟合的方法有哪些？ [简书]

v-space

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
神经网络训练Trick-Label Smoothing(标签平滑)

Label Smoothing是为了防止训练过拟合而提出。提出原因：one-hot encoding(独热编码)：在分类问题中，常常通过softmax将输出向量转化为独热编码，即正类为1，其他为0。对于N分类问题，每一类对应一个N维向量:#label及其所对应的one-hot编码对应如下:label=[0,1,2,3,4,5,6]one_hot_encode = [[1,0,0,...
复制链接

扫一扫