一种来自CVPR上简单实用的数据增强方式:YOCO (You Only Cut Once)数据增强

本文介绍了YOCO(YouOnlyCutOnce)在牛场复杂环境下的应用,通过分割并独立增强图像片段,显著提升了YOLOv5模型的检测精度。作者展示了YOCO算法在数据增强方面的有效性,特别是在面对光照、背景干扰时的提升效果明显。
摘要由CSDN通过智能技术生成

YOCO (You Only Cut Once)数据增强方式简介

YOCO是澳大利亚联邦科学与工业研究组织(CSIRO)和澳大利亚国立大学等单位联合在CVPR上发的一种新的数据增强方式。主要原理是将一张图片横向或纵向分割成两个相等的部分,然后分别在每个部分独立执行相同/不同的数据增强操作,增强后的两部分再拼接回一个完整的图像(简单说,YOCO是将一幅图像在高度或宽度维度上等分为两块,在每个片段中独立地执行相同的数据扩充,然后将增强片段连接在一起,形成一个单独的增强图像)。具体的数据增强方式如下所示。
原文链接(点击进入)
在这里插入图片描述
第一次看到这种数据增强的方式后,我觉得实用性还可以然后把这种方法借鉴到了我自己的论文中,经验证确实有用,增强了几个百分点,可以说是复杂环境下目标检测的涨点神器了哈。接下来就主要介绍下我是如何运用这种方法的。
首先附上我论文链接:原文链接(点击进入)

目标检测数据集介绍

我需要实现的功能是牛场复杂环境下犊牛头部和躯干目标检测。这里主要介绍数据集是如何获取的:
首先,将很多段视频分解为视频帧图像序列,从中随机选择2760张不同环境、不同干扰因素和不同姿态的犊牛图像,数据增强后获得5520张图像用于YOLOv5检测模型训练、验证及测试。
然后,采用GitHub上的开源脚本LabelImg(https://github.com/tzutalin/labelImg)对数据集犊牛头部和躯干进行标注(头部标注为head,躯干标注为trunk),最终获得图像和对应标注文件。
最后,将图像数据集以7:2:1的比例随机分成训练集、验证集和测试集。其中,训练集大小为3864张,验证集大小为1104张,测试集大小为552张。训练集和验证集用于模型训练,测试集用于模型测试。

YOCO算法原理

由于犊牛舍实际环境存在背景干扰较大等问题,光线等复杂环境易影响识别效果,为提高模型的鲁棒性和泛化性,采用YOCO方法增强数据集,以下内容主要介绍YOCO算法。
首先,将 a(.)表示为图像 X(X∈R)增强的一种方式,则传统图像增强表示如式(1)所示。
在这里插入图片描述
式中,X’表示增强后的图像, a(.)表示为图像 X(X∈R)增强的一种方式。
YOCO数据增强与式(1)普通数据增强方式不同,YOCO首先从图像H和W以相同的概率将图像X切割成两个大小相等的块,如式(2)所示:
在这里插入图片描述
式中,p表示(0,1)获得的等概率的值,Xi表示切割后的图像,cutH(X)和cutW(X)分别表示从图像的高度和图像的宽度进行切割。
切割后的图像在每个片段中分别使用进行数据增强,最后将图像拼接在一起,如式(3)所示:
在这里插入图片描述
式中,concat[., .]表示图像拼接,X’表示拼接后的图像。
YOCO数据增强方式选取的图像增强方法具随机性,针对实际牛场犊牛背景干扰和光线复杂等问题,选取图像增强方法如下:随机亮度调整、椒盐噪声、高斯噪声、高斯模糊。

YOCO算法原理示意

我的数据集是犊牛,在这种复杂环境下使用的YOCO算法原理示意如下所示。
在这里插入图片描述

YOCO算法结果

为展示YOCO图像增强方法性能,将未进行图像级增强数据集与使用YOCO算法增强数据集的测试结果进行对比,采用YOCO方法增强数据集前后测试结果如下图所示,与不使用数据增强的YOLOv5目标检测相比,使用YOCO方法增强数据集后Precious、Recall、Fscore、mAP50和mAP50:95分别提高了4.7、3.2、4.0、0.9和1.1个百分点,以上结果表明,YOCO能有效提高网络模型检测性能。
在这里插入图片描述

总结

个人感觉这种数据增强的方式还是有效果的,尤其是针对复杂环境下的数据集,大家有机会的可以试一试!祝各位科研、工作顺利!

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值