目标立体检测 红外图像_URPC 2019水下目标检测竞赛冠军方案:多图像融合增强...

9d2d5078e629e668cac3360b052d88da.png

下面要介绍的论文发于2019年12月,题为「ROIMIX: PROPOSAL-FUSION AMONG MULTIPLE IMAGESFOR UNDERWATER OBJECT DETECTION」,axriv地址为:https://arxiv.org/abs/1911.03029。

30b66cfbaec4dac872a85c53c1535ce2.png

近年来,通用的目标检测算法已经证明了其卓越的性能。然而,关于水下目标检测的话题却很少被研究。和一般的数据集相比,水下图像通常具有色偏和低对比度的特点,并且沉淀物也会导致水下图像模糊。另外,由于水下动物的生活习性,它们通常在图像上挨得很近。为了解决这些问题,本论文的工作是研究增强策略以模拟重叠,遮挡和模糊的目标,并构建一个可以有更好的泛化能力的模型。论文提出了一种称为ROIMIX的增强方法,该方法可以表征图像之间的相互作用。之前的图像增强方法都是在单张图像上运行,而ROIMIX是应用于多个图像以创建增强后的训练样本数据。实验结果表明,此方法在PASCAL VOC数据集和URPC数据集上均提高了双阶段目标检测器的性能。

一、研究背景

很多目标检测器在通用数据集如PACCAL VOC,MSCOCO上实现了比较好的性能。然而,水下环境更加复杂并且由于光照影响导致水下图像往往存在对比度低,纹理失真和光照不均匀的特点,这导致检测更加困难。

ddaba811cb5b3564aefb52cbc2d48a62.png

Figure1(a)展示了密集分布的生物,它们彼此覆盖,并且因为一些沉淀物变得模糊。水下机器人检测比赛(URPC)提供了有挑战性的水下目标检测数据集,该数据集包含大量重叠,遮挡和模糊的水下生物。现有的数据增强方法对重叠,遮挡和模糊目标还没有进行很好的研究。如果检测模型仅仅适应训练数据,它将缺乏泛化能力,无法应对复杂的水下环境。

因此,论文提出通过在多个图像之间混合候选区域来模拟目标的重叠,遮挡和模糊。从理论上分析,遵循经验风险最小化原则(ERM),深度模型致力于最小化训练数据上的平均误差,但是它们有过拟合的风险。具体来说,ERM指导深层模型记忆训练数据,而不是从中概况。同时,这些模型容易受到对抗样本的攻击。数据增强被用来缓解过拟合问题,根据最小风险(VRM)原则,通过增强策略在类似于训练数据的样本上对模型进行了优化。在图像分类领域,平移和翻转是增强训练数据量的常用策略。

诸如Mixup,CutMix之类的方法致力于创造更好的训练数据。本文提出了一种称为RoIMix的数据增强算法,可以提高模型对重叠,遮挡和模糊目标的检测能力。这个方法被用于双阶段检测器如Faster-RCNN上,和之前在单个物体上进行数据增强的方法相比,ROIMIX更注重图像之间的交互。直接在目标检测中应用像Mixup这样的图像级融合会导致来自不同图像的区域建议框未对齐,如Figure1(b)所示。

为了准确模拟重叠,遮挡和模糊的情况,论文执行了候选框级别融合。用这种方式,此方法在Pascal VOC和URPC上取得了出色的目标检测性能,并在URPC 2019水下目标检测竞赛上夺冠。

二、相关工作

数据增强

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值