一种来自CVPR上简单实用的数据增强方式：YOCO (You Only Cut Once)数据增强

最新推荐文章于 2024-07-06 10:53:20 发布

小小凡sir

最新推荐文章于 2024-07-06 10:53:20 发布

阅读量1k

点赞数 10

文章标签：目标检测 python 图像处理 opencv 计算机视觉算法

本文链接：https://blog.csdn.net/weixin_50233398/article/details/138303393

版权

本文介绍了YOCO（YouOnlyCutOnce）在牛场复杂环境下的应用，通过分割并独立增强图像片段，显著提升了YOLOv5模型的检测精度。作者展示了YOCO算法在数据增强方面的有效性，特别是在面对光照、背景干扰时的提升效果明显。

摘要由CSDN通过智能技术生成

YOCO (You Only Cut Once)数据增强方式简介

YOCO是澳大利亚联邦科学与工业研究组织(CSIRO)和澳大利亚国立大学等单位联合在CVPR上发的一种新的数据增强方式。主要原理是将一张图片横向或纵向分割成两个相等的部分，然后分别在每个部分独立执行相同/不同的数据增强操作，增强后的两部分再拼接回一个完整的图像（简单说，YOCO是将一幅图像在高度或宽度维度上等分为两块，在每个片段中独立地执行相同的数据扩充，然后将增强片段连接在一起，形成一个单独的增强图像）。具体的数据增强方式如下所示。
原文链接（点击进入）
在这里插入图片描述
第一次看到这种数据增强的方式后，我觉得实用性还可以然后把这种方法借鉴到了我自己的论文中，经验证确实有用，增强了几个百分点，可以说是复杂环境下目标检测的涨点神器了哈。接下来就主要介绍下我是如何运用这种方法的。
首先附上我论文链接：原文链接（点击进入）

目标检测数据集介绍

我需要实现的功能是牛场复杂环境下犊牛头部和躯干目标检测。这里主要介绍数据集是如何获取的：
首先，将很多段视频分解为视频帧图像序列，从中随机选择2760张不同环境、不同干扰因素和不同姿态的犊牛图像，数据增强后获得5520张图像用于YOLOv5检测模型训练、验证及测试。
然后，采用GitHub上的开源脚本LabelImg（https://github.com/tzutalin/labelImg）对数据集犊牛头部和躯干进行标注（头部标注为head，躯干标注为trunk），最终获得图像和对应标注文件。
最后，将图像数据集以7：2：1的比例随机分成训练集、验证集和测试集。其中，训练集大小为3864张，验证集大小为1104张，测试集大小为552张。训练集和验证集用于模型训练，测试集用于模型测试。

YOCO算法原理

由于犊牛舍实际环境存在背景干扰较大等问题，光线等复杂环境易影响识别效果，为提高模型的鲁棒性和泛化性，采用YOCO方法增强数据集，以下内容主要介绍YOCO算法。
首先，将 a(.)表示为图像 X（X∈R）增强的一种方式，则传统图像增强表示如式（1）所示。
在这里插入图片描述
式中，X’表示增强后的图像， a(.)表示为图像 X（X∈R）增强的一种方式。
YOCO数据增强与式（1）普通数据增强方式不同，YOCO首先从图像H和W以相同的概率将图像X切割成两个大小相等的块，如式（2）所示：
在这里插入图片描述
式中，p表示（0,1）获得的等概率的值，Xi表示切割后的图像，cutH(X)和cutW(X)分别表示从图像的高度和图像的宽度进行切割。
切割后的图像在每个片段中分别使用进行数据增强，最后将图像拼接在一起，如式（3）所示：
在这里插入图片描述
式中，concat[., .]表示图像拼接，X’表示拼接后的图像。
YOCO数据增强方式选取的图像增强方法具随机性，针对实际牛场犊牛背景干扰和光线复杂等问题，选取图像增强方法如下：随机亮度调整、椒盐噪声、高斯噪声、高斯模糊。

YOCO算法原理示意

我的数据集是犊牛，在这种复杂环境下使用的YOCO算法原理示意如下所示。
在这里插入图片描述

YOCO算法结果

为展示YOCO图像增强方法性能，将未进行图像级增强数据集与使用YOCO算法增强数据集的测试结果进行对比，采用YOCO方法增强数据集前后测试结果如下图所示，与不使用数据增强的YOLOv5目标检测相比，使用YOCO方法增强数据集后Precious、Recall、Fscore、mAP50和mAP50：95分别提高了4.7、3.2、4.0、0.9和1.1个百分点，以上结果表明，YOCO能有效提高网络模型检测性能。
在这里插入图片描述