目标检测中的数据增强：mosaic，mixup，cutout，cutmix

最新推荐文章于 2025-03-10 11:17:13 发布

杨芋土豆

最新推荐文章于 2025-03-10 11:17:13 发布

阅读量3.2k

点赞数 5

分类专栏：目标检测文章标签：深度学习

本文链接：https://blog.csdn.net/qq_40395121/article/details/119345892

版权

本文详细介绍了目标检测中cutmix、cutout、mixup及mosaic四种数据增强方法的实现原理与过程，并提供了计算loss的具体步骤。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

认真读绝对不亏，不要看到全是字就怕了。

最近学目标检测，在看yolov4的时候，看到了mosaic数据增强方法，所以查阅了一些知识，因为网上的讲解都注重于原理，不注重详细的实现方法以及细节，而工程项目缺的就是详细的实现方法。现根据自己的理解，通过举例子的方式做好笔记，整理如下，以便以后查阅。

cutmix：假设有A，B两张图，都是448*448，现随机生成一个box，假设生成（50,60,70,80），50和60分别表示box的左上角左边，70,80分别表示box的右下角。然后在A图上将box对应所在的位置用B图上对应位置进行替代。

如何计算loss：使用的loss是交叉熵，计算lam = box的面积占图片面积的比例= (70-50)(80-60)/(448*448)，loss有两部分，第一部分是没有替代时候的target与模型输出做交叉熵，然后这部分乘以(1-lam)，理解为：对所有图片中未被替代的部分做loss乘以未被替代部分占原始图像的比例。第二部分，是被替代的部分的target与模型输出做交叉熵，然后乘以lam，理解为：对所有图片中被替代的部分做loss乘以被替代部分占原始图像