【论文阅读】Context-aware Cross-level Fusion Network for Camouflaged Object Detection(IJCAI2021)

论文题目:Context-aware Cross-level Fusion Network for Camouflflaged Object Detection

论文地址:https://arxiv.org/pdf/2105.12555.pdf

代码地址:https://github.com/thograce/C2FNet

 

文章贡献:

1. 提出了一个新的伪装目标检测模型C2F-Net,它整合了跨层特征,并考虑了丰富的全局上下文信息;

2. 提出了一个上下文感知模块DGCM,该模块可从融合的特征中获取全局上下文信息;

3. 提出了一个有效的融合模块ACFM集成跨层特征,该模块将特征与MSCA提供的有价值的注意线索集成在一起。

 

1 背景与动机

论文解决的是伪装目标检测(camouflflaged object detection,COD)的问题。由于伪装,物体和周围环境之间的边界对比度非常低,从而导致难以准确识别:

 

2 方法框架

总体架构

使用Res2Net50来获取5个stage的特征,对高维度特征E3\E4\E5使用接收域块(receptive fifield block,RFB)来扩展接收域,捕获更丰富的特征。

之后将E4和E5经过RFB后的结果输入注意诱导的跨级融合模块(Attention-induced Cross-level Fusion Module ,ACFM)集成多尺度特征,再经过双分支全局上下文模块(Dual-branch Global Context Module ,DGCM)来获取上下文信息。同样的,对E3经过RFB后的结果也经过上述处理,最终得到预测结果。

其中,RFB的结构如下,输出Y的通道数为64:

 

ACFM

由于相同的目标物体可能由于拍摄原因在图像中存在大小不同的问题,因此论文提出ACFM来集成多尺度特征。

对输入的2个特征Fa和Fb,将Fb上采样到与Fa相同的大小,进行相加的操作获得融合了不同尺度特征的总特征xy。将xy输入MSCA模块,获得输出结果wei,wei和wei的反向分别与Fa和上采样的Fb相乘,再将这两者相加,得到xo。最后xo经过3x3卷积,得到最终的输出特征F。

其中MSCA(Multi-Scale Channel Attention)的结构如下:

对输入的特征X经过一个双分支结构,分支1是局部注意分支,由1x1卷积+BN+ReLU+1x1卷积+BN组成。分支2是全局注意分支,由全局池化+1x1卷积+BN+ReLU+1x1卷积+BN组成。最后将双分支的结果经过加总,在经过sigmoid函数,得到输出特征W。

 

DGCM

全局上下文信息是提高伪装目标检测性能的关键,因此论文提出DGCM模块来获取上下文信息。

输入特征F经过两个分支,分支1对F进行3x3卷积操作得到Fc(CxHxW),再将Fc和Fc经过MSCA模块后的输入相乘,得到Fcm。分支2对F进行池化+3X3卷积操作得到Fp(CxW/2xH/2),跟Fc进行同样的操作后得到Fpm。之后将Fpm进行上采样并与Fcm相加,经过3x3卷积,加上特征F后再次经过3x3卷积,最终得到输出特征F'。

 

损失函数

使用加权二值交叉熵损失和加权IoU损失。

 

3 实验结果

数据集

  1. CHAMELEON,包含76张伪装图像;
  2. CAMO,1.25k图像,共8个类别;
  3. COD10K,共5066张图像,包含5个大类和69个子类。

评价指标 

  1. MAE,评估归一化后的pred和GT之间的平均像素级相对误差;
  2. 加权F-measure,考虑加权精度和加权查全率的综合性能测度;
  3. S-measure,计算pred与GT之间的对象感知和区域感知结构相似性;
  4. E-measure,基于人类视觉感知机制来评估COD的整体和局部准确性。

 

与先进方法的比较:

各模块消融实验:

MSCA消融实验,第一列表示使用卷积操作替换MSCA模块:

  • 7
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
"Depth Confidence-aware Camouflaged Object Detection" 是一篇关于深度置信感知伪装目标检测的论文。该论文介绍了一种用于检测伪装目标的新方法,该方法结合了深度信息和置信度感知。 伪装目标指的是那些在外观上与周围环境相似,很难被人眼或传统算法准确识别的目标。传统的目标检测方法在处理伪装目标时往往存在困难,因为伪装目标与背景具有相似的颜色、纹理或形状,导致目标难以被区分。 该论文中提出的方法通过结合深度信息和置信度感知来解决伪装目标检测的问题。具体而言,该方法首先利用深度传感器(如RGB-D相机)获取场景的深度信息,将其与RGB图像进行融合。然后,使用深度信息来提取特征,并通过深度感知模块来增强目标的边缘和轮廓特征。 此外,该方法还引入了置信度感知模块,用于评估每个像素点的置信度。置信度可以根据像素点的深度、颜色、纹理等信息计算得出。通过增强高置信度区域的特征表示,可以提高对伪装目标的检测能力。 最后,该方法使用深度置信感知的特征表示进行目标检测和分割。实验结果表明,该方法在多个公开数据集上取得了较好的性能,并且在伪装目标检测任务上相比其他方法具有明显的优势。 综上所述,"Depth Confidence-aware Camouflaged Object Detection" 这篇论文提出了一种利用深度信息和置信度感知来检测伪装目标的新方法。通过结合深度和置信度信息,该方法能够提高对伪装目标的检测准确性和鲁棒性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值