Camouflaged Object Detection阅读笔记

最新推荐文章于 2025-04-09 17:42:23 发布

Ma lidong

最新推荐文章于 2025-04-09 17:42:23 发布

阅读量2.9k

点赞数

分类专栏：伪装目标检测论文阅读文章标签：计算机视觉深度学习人工智能原力计划

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41684249/article/details/115703134

版权

伪装目标检测论文阅读专栏收录该内容

19 篇文章

订阅专栏

CVPR 2020
Deng-Ping Fan, Ge-Peng Ji, Guolei Sun, Ming-Ming Cheng, Jianbing Shen, Ling Shao
https://openaccess.thecvf.com/content_CVPR_2020/html/Fan_Camouflaged_Object_Detection_CVPR_2020_paper.html

一、简介

伪装目标检测任务旨在识别“无缝”嵌入其周围环境中的目标。该目标物体与背景之间有高度的内在相似性。

为了解决该问题，我们收集了一个新的数据集，称为COD10K，它包括10000幅图像，涵盖了各种自然场景中伪装的对象，超过78个对象类别。

此外，我们提出了一个COD模型，叫做Search Identification Network（SINet）。SINet的总训练时间仅需一个小时，并且在所有测试数据集上都优于各种先进的对象检测框架。

二、COD数据集

2.1 相关数据集

在这里插入图片描述

CHAMELEON数据集是一个未公开的数据集，只有76幅带有手动标注的GTs。这些图像是通过谷歌搜索引擎使用“伪装的动物”作为关键词从互联网上搜集的。

CAMO数据集有2500张图像，其中2000张用于训练，500张用于测试，涵盖了8各种类。它有两个子数据集，CAMO和MS-COCO，每个数据集含有1250张图像。

2.2 COD10K数据集

本文的一项重点工作就是收集了COD10K数据集。COD10K是迄今为止最大的COD数据集，包含10000张图像，其中，6000张用于训练，4000张用于测试。

不同于现有数据集的点：

该数据集包含10000张图像，涵盖78个伪装物体类别。
所有伪装的图像都用类别、边界框、对象标注和实例标注，便于如定位、对象检测、语义边缘分割和任务转移学习等视觉任务。
每个伪装图像都被赋予了现实世界中具有挑战性的属性，并进行抠图标注。这些高质量标注有助于更深入了解算法的性能。

细节：

COD10K包含10000个图像(5066个伪装图像，3000个背景图像，1934个非伪装图像)，分为10个超类和78个子类（69个伪装，9个非伪装），这些图像来自于多个摄影网站。

三、SINet模型

在这里插入图片描述

3.1 概述

在狩猎时，捕食者会首先判断是否存在潜在的猎物，即它会寻找猎物；然后，可以识别目标动物；最后，它可以被抓住。

受此启发，提出了SINet模型，它主要有两个模块，一个是搜索模型（SM），用来搜索伪装物体，另一个是识别模型（IM），用来精确检测。

3.2 Search Module（SM）

在这里插入图片描述

对于输入图像I，使用ResNet50提取特征，从而得到X0、X1、X2、X3和X4五个feature maps。为了保留更多的信息，在第二层中将stride改为1。

已经有研究表明，浅层的低级特征为构建对象边界保留了空间细节，而深层的高级特征为定位对象保留了语义信息。

我们将提取的低级特征X0和X1、中级特征X2、高级特征X3和X4通过级联、上采样和下采样的操作进行组合，这是为了从不同的层中保留更多的信息。然后使用RF组件来扩大感受野。

3.3 Identification Module（IM）

在从SM模块获取候选特征之后，在IM模块中，需要精确的检测伪装对象。

我们提出了partial decoder component（PDC）模块，它集成了四个级别功能，具有密集连接的特性。其结构如整体框架图。

在这里插入图片描述

首先使用PDS提取粗略的伪装图Cs。rf是输入。

在这里插入图片描述

现有研究表明，注意力机制可以有效地消除无关特性的干扰。我们引入了search attention（SA）模块来增强中级特征X2。

在这里插入图片描述

为了整体地获得高级特征，我们进一步利用PDC来聚合另外三层特征，通过射频功能增强，并获得我们最终的伪装图Ci。

3.4 损失函数

在这里插入图片描述

Cs和Ci是伪装物体图。

四、实验

4.1 实施细节

使用Adam优化器，batch size为36，学习率从1e-4次开始，输入图像为352×352。

4.2 实验结果

在这里插入图片描述

GOD在伪装目标检测上的效果要差于SOD，这表明SOD可能是更适合扩展到COD任务的框架。

在这里插入图片描述

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Ma lidong 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。