YOLOV4知识点分析（二）

最新推荐文章于 2024-08-06 16:18:03 发布

wujianming_110117

最新推荐文章于 2024-08-06 16:18:03 发布

阅读量467

点赞数

分类专栏：神经网络深度学习目标检测

吴建明

本文链接：https://blog.csdn.net/wujianing_110117/article/details/106031296

版权

本文深入分析了YOLOV4中的数据增强技术，包括mixup、cutmix及其扩展Mosaic策略，强调它们如何提升模型的分类和定位能力。此外，还探讨了Stylized-ImageNet数据集在减少纹理干扰、提高模型对形状关注的作用，以及DropBlock作为卷积网络正则化方法的原理和应用。

摘要由CSDN通过智能技术生成

YOLOV4知识点分析（二）

数据增强相关-mixup

论文名称：mixup: BEYOND EMPIRICAL
RISK MINIMIZATION

论文地址：https://arxiv.org/abs/1710.09412

mixup由于非常有名，大家都应该知道，而且网上各种解答非常多，故这里就不重点说了。

其核心操作是：两张图片采用比例混合，label也需要混合。

在这里插入图片描述

论文中提到的一些关键的Insight：

1 也考虑过三个或者三个以上的标签做混合，但是效果几乎和两个一样，而且增加了mixup过程的时间。

2 当前的mixup使用了一个单一的loader获取minibatch，对其随机打乱后，mixup对同一个minibatch内的数据做混合。这样的策略和在整个数据集随机打乱效果是一样的，而且还减少了IO的开销。

3 在同种标签的数据中使用mixup不会造成结果的显著增强

数据增强相关-cutmix和Mosaic

论文名称：CutMix: Regularization
Strategy to Train Strong Classifiers with Localizable Features

论文地址：https://arxiv.org/abs/1905.04899

开源地址：https://github.com/clovaai/CutMix-PyTorch

在这里插入图片描述

mixup相当于是全图融合，cutout仅仅对图片进行增强，不改变label，而cutmix则是采用了cutout的局部融合思想，并且采用了mixup的混合label策略，看起来比较make sense。

cutmix和mixup的区别是，其混合位置是采用hard 0-1掩码，而不是soft操作,相当于新合成的两张图是来自两张图片的hard结合，而不是Mixup的线性组合。但是其label还是和mixup一样是线性组合。作者认为mixup的缺点是：Mixup samples suffer from the fact that they are locally ambiguous

and unnatural, and therefore confuses the model, especially for localization。

在这里插入图片描述