YoloV4当中的Mosaic数据增强方法（附代码讲解）

最新推荐文章于 2024-07-06 21:27:32 发布

码农的后花园

最新推荐文章于 2024-07-06 21:27:32 发布

阅读量7.7k

点赞数 12

分类专栏：搞懂目标检测文章标签：深度学习 python 计算机视觉人工智能 csv

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45192980/article/details/107888746

版权

上一期中讲解了图像分类和目标检测中的数据增强的区别和联系，这期讲解数据增强的进阶版- yolov4中的Mosaic数据增强方法以及CutMix。

前言

Yolov4的mosaic数据增强参考了CutMix数据增强方式, 是CutMix数据增强方法的改进版。不同于一般的数据增强的方式是对一张图片进行扭曲、翻转、色域变化，CutMix数据增强方式是对两张图片进行拼接变为一张新的图片，然后将拼接好了的图片传入到神经网络中去学习，如下图。

CutMix的处理方式比较简单，对一对图片做操作，简单讲就是随机生成一个裁剪框Box,裁剪掉A图的相应位置，然后用B图片相应位置的ROI放到A图中被裁剪的区域形成新的样本，计算损失时同样采用加权求和的方式进行求解。就是将图A一部分区域cut掉但不填充0像素，然后随机填充训练集中的其他数据的区域像素值，分类结果按一定的比例分配。

下图是使用CutMix方法对常见的数据集进行数据增强的表现，可以看到有明显的提升。

Mosaic数据增强方法

mosaic数据增强则利用了四张图片，对四张图片进行拼接，每一张图片都有其对应的框框，将四张图片拼接之后就获得一张新的图片，同时也获得这张图片对应的框框，然后我们将这样一张新的图片传入到神经网络当中去学习，相当于一下子传入四张图片进行学习了。论文中说这极大丰富了检测物体的背景！且在标准化BN计算的时候一下子会计算四张图片的数据！如下图所示：

实现过程

这里以对Voc2007数据集进行随机数据增强为例进行讲解，大致分为四步：

第一步：从Voc数据集中每次随机读取四张图片

第二步：分别对四张图片进行翻转（对原始图片进行左右的翻转）、缩放（对原始图片进行大小的缩放）、色域变化（对原始图片的明亮度、饱和度、色调进行改变）等操作。

操作完成之后然后再将原始图片按照第一张图片摆放在左上，第二张图片摆放在左下，第三张图片摆放在右下，第四张图片摆放在右上四个方向位置摆好。

3、进行图片的组合和框的组合

完成四张图片的摆放之后，我们利用矩阵的方式将四张图片它固定的区域截取下来，然后将它们拼接起来，拼接成一张新的图片，新的图片上含有框框等一系列的内容。

如上图可以看到我们将四张图片进行拼接的时候有很明显的边缘，横线和竖线就是分割的线，这个分割线是由我们人为事先预先设定好了的，在代码中由min_off

最低0.47元/天解锁文章

码农的后花园

关注

12
点赞
踩
57

收藏

觉得还不错? 一键收藏
19
评论
YoloV4当中的Mosaic数据增强方法（附代码讲解）

上一期中讲解了图像分类和目标检测中的数据增强的区别和联系，这期讲解数据增强的进阶版- yolov4中的Mosaic数据增强方法以及CutMix。前言Yolov4的mosaic数据增强参考...
复制链接

扫一扫

专栏目录

评论 19

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。