Camouflaged Object Detection阅读笔记

CVPR 2020
Deng-Ping Fan, Ge-Peng Ji, Guolei Sun, Ming-Ming Cheng, Jianbing Shen, Ling Shao
https://openaccess.thecvf.com/content_CVPR_2020/html/Fan_Camouflaged_Object_Detection_CVPR_2020_paper.html

一、简介

伪装目标检测任务旨在识别“无缝”嵌入其周围环境中的目标。该目标物体与背景之间有高度的内在相似性。

为了解决该问题,我们收集了一个新的数据集,称为COD10K,它包括10000幅图像,涵盖了各种自然场景中伪装的对象,超过78个对象类别。

此外,我们提出了一个COD模型,叫做Search Identification Network(SINet)。SINet的总训练时间仅需一个小时,并且在所有测试数据集上都优于各种先进的对象检测框架。

二、COD数据集

2.1 相关数据集

在这里插入图片描述

CHAMELEON数据集是一个未公开的数据集,只有76幅带有手动标注的GTs。这些图像是通过谷歌搜索引擎使用“伪装的动物”作为关键词从互联网上搜集的。

CAMO数据集有2500张图像,其中2000张用于训练,500张用于测试,涵盖了8各种类。它有两个子数据集,CAMO和MS-COCO,每个数据集含有1250张图像。

2.2 COD10K数据集

本文的一项重点工作就是收集了COD10K数据集。COD10K是迄今为止最大的COD数据集,包含10000张图像,其中,6000张用于训练,4000张用于测试。

不同于现有数据集的点:

该数据集包含10000张图像,涵盖78个伪装物体类别。
所有伪装的图像都用类别、边界框、对象标注和实例标注,便于如定位、对象检测、语义边缘分割和任务转移学习等视觉任务。
每个伪装图像都被赋予了现实世界中具有挑战性的属性,并进行抠图标注。这些高质量标注有助于更深入了解算法的性能。

细节:

COD10K包含10000个图像(5066个伪装图像,3000个背景图像,1934个非伪装图像),分为10个超类和78个子类(69个伪装,9个非伪装),这些图像来自于多个摄影网站。

三、SINet模型

在这里插入图片描述

3.1 概述

在狩猎时,捕食者会首先判断是否存在潜在的猎物,即它会寻找猎物;然后,可以识别目标动物;最后,它可以被抓住。

受此启发,提出了SINet模型,它主要有两个模块,一个是搜索模型(SM),用来搜索伪装物体,另一个是识别模型(IM),用来精确检测。

3.2 Search Module(SM)

在这里插入图片描述

对于输入图像I,使用ResNet50提取特征,从而得到X0、X1、X2、X3和X4五个feature maps。为了保留更多的信息,在第二层中将stride改为1。

已经有研究表明,浅层的低级特征为构建对象边界保留了空间细节,而深层的高级特征为定位对象保留了语义信息。

我们将提取的低级特征X0和X1、中级特征X2、高级特征X3和X4通过级联、上采样和下采样的操作进行组合,这是为了从不同的层中保留更多的信息。然后使用RF组件来扩大感受野。

3.3 Identification Module(IM)

在从SM模块获取候选特征之后,在IM模块中,需要精确的检测伪装对象。

我们提出了partial decoder component(PDC)模块,它集成了四个级别功能,具有密集连接的特性。其结构如整体框架图。

在这里插入图片描述

首先使用PDS提取粗略的伪装图Cs。rf是输入。

在这里插入图片描述

现有研究表明,注意力机制可以有效地消除无关特性的干扰。我们引入了search attention(SA)模块来增强中级特征X2。

在这里插入图片描述

为了整体地获得高级特征,我们进一步利用PDC来聚合另外三层特征,通过射频功能增强,并获得我们最终的伪装图Ci。

3.4 损失函数

在这里插入图片描述

Cs和Ci是伪装物体图。

四、实验

4.1 实施细节

使用Adam优化器,batch size为36,学习率从1e-4次开始,输入图像为352×352。

4.2 实验结果

在这里插入图片描述

GOD在伪装目标检测上的效果要差于SOD,这表明SOD可能是更适合扩展到COD任务的框架。

在这里插入图片描述

  • 0
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
"Depth Confidence-aware Camouflaged Object Detection" 是一篇关于深度置信感知伪装目标检测的论文。该论文介绍了一种用于检测伪装目标的新方法,该方法结合了深度信息和置信度感知。 伪装目标指的是那些在外观上与周围环境相似,很难被人眼或传统算法准确识别的目标。传统的目标检测方法在处理伪装目标时往往存在困难,因为伪装目标与背景具有相似的颜色、纹理或形状,导致目标难以被区分。 该论文中提出的方法通过结合深度信息和置信度感知来解决伪装目标检测的问题。具体而言,该方法首先利用深度传感器(如RGB-D相机)获取场景的深度信息,将其与RGB图像进行融合。然后,使用深度信息来提取特征,并通过深度感知模块来增强目标的边缘和轮廓特征。 此外,该方法还引入了置信度感知模块,用于评估每个像素点的置信度。置信度可以根据像素点的深度、颜色、纹理等信息计算得出。通过增强高置信度区域的特征表示,可以提高对伪装目标的检测能力。 最后,该方法使用深度置信感知的特征表示进行目标检测和分割。实验结果表明,该方法在多个公开数据集上取得了较好的性能,并且在伪装目标检测任务上相比其他方法具有明显的优势。 综上所述,"Depth Confidence-aware Camouflaged Object Detection" 这篇论文提出了一种利用深度信息和置信度感知来检测伪装目标的新方法。通过结合深度和置信度信息,该方法能够提高对伪装目标的检测准确性和鲁棒性。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Ma lidong

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值