【YOLOv4探讨之四】标签平滑Label Smoothing

北溟客

于 2021-03-30 23:04:21 发布

阅读量3.2k

点赞数 3

分类专栏： YOLOv4 文章标签：人工智能深度学习机器学习

本文链接：https://blog.csdn.net/qq_41736617/article/details/115338124

版权

YOLOv4中，为了防止分类过拟合，使用了标签平滑Label Smoothing的技术。Label Smoothing最早源于论文《Rethinking the inception architecture for computer vision》，这里不讨论。基本原理如下：通常YOLO模型中，80个分类标签都是使用0或1进行描述，在训练过程中，如果认为属于第n个分类，则该位置输出1（这种分类标签编码形式也称为one hot编码，即一位（独热）编码）。在数据集为无穷的情况下，可以对所有分类进行训练和标记，

摘要由CSDN通过智能技术生成

YOLOv4中，为了防止分类过拟合，使用了标签平滑Label Smoothing的技巧。
Label Smoothing最早源于论文《Rethinking the inception architecture for computer vision》，这里不讨论。基本原理如下：通常YOLO模型中，80个分类标签都是使用0或1进行描述，在训练过程中，如果认为属于第n个分类，则该位置输出1（这种分类标签编码形式也称为one hot编码，即一位（独热）编码）。在数据集为无穷的情况下，可以对所有分类进行训练和标记，但是数据集不可能是无穷，尤其是当数据集量并不太大的时候，训练次数过多，很容易造成过拟合。采用Label Smoothing的技巧可以将标签的确定性减弱，从而降低过拟合的可能性。
在YOLOv4的实际代码中，将Label Smoothing体现在了计算分类函数求导得到的delta中，YOLO模型的分类求导和反向传播可以参考文章《YOLO中LOSS函数的计算》（https://editor.csdn.net/md/?articleId=106583800）和《YOLOv3反向传播原理之全流程源码分析》（https://editor.csdn.net/md/?articleId=107303735）。
关于Label Smoothing的实际操作具体而言，令
$label_{true_{}} ^{smooth}= label_{true_{}} ×(1-α)+label_{true_{}} ×α$

最低0.47元/天解锁文章

北溟客

关注

3
点赞
踩
8

收藏

觉得还不错? 一键收藏
打赏
1
评论
【YOLOv4探讨之四】标签平滑Label Smoothing

YOLOv4中，为了防止分类过拟合，使用了标签平滑Label Smoothing的技术。Label Smoothing最早源于论文《Rethinking the inception architecture for computer vision》，这里不讨论。基本原理如下：通常YOLO模型中，80个分类标签都是使用0或1进行描述，在训练过程中，如果认为属于第n个分类，则该位置输出1（这种分类标签编码形式也称为one hot编码，即一位（独热）编码）。在数据集为无穷的情况下，可以对所有分类进行训练和标记，
复制链接

扫一扫