Confidence-Aware Learning for Camouflaged Object Detection阅读笔记

最新推荐文章于 2023-03-28 21:23:34 发布

Ma lidong

最新推荐文章于 2023-03-28 21:23:34 发布

阅读量809

点赞数 1

分类专栏：伪装目标检测论文阅读文章标签：人工智能深度学习神经网络计算机视觉原力计划

本文链接：https://blog.csdn.net/qq_41684249/article/details/119841605

版权

19 篇文章 69 订阅

订阅专栏

arXiv 2021
Jiawei Liu, Jing Zhang, Nick Barnes
论文地址

一、简介

提出了一个置信度感知伪装对象检测框架，该框架具有相互依赖的伪装对象检测网络和置信度估计网络，为难度感知学习提供相互指导；

提出了一种动态置信度监督，它使用伪装对象检测网络的预测与真实标签之间的差异来训练置信度估计网络，然后输出像素级置信度，显示真阴性和假阳性预测防止网络变得过于自信；

我们的置信估计网络可以在不依赖于真实情况的情况下提供对预测的初步评估，实验结果表明我们的方法与最先进的方法相比具有优势。

在这里插入图片描述
CANet网络主要包含两个主要模块：1）用于生成伪装maps的伪装对象检测网络（COD Network）；2）用于估计当前预测的置信度的置信度估计网络（Confidence Network）。

在这里插入图片描述

使用ResNet-50作为backbone提取特征（ $F_{i}(i=1,2,...,5)$ ）。
如Figure3所示，设计了Fusion Module (FM) 模块来融合高级信息与低级信息。F2特征在融合中提供更多的空间信息，这对于恢复更清晰的结构是有用的。
通过Hollistic Attention Module(HA)来得到F6特征。F7和F8通过残差块得到。

如Figure2所示，置信度估计网络采用UNet结构来获得像素精确的置信度预测，由五个up-convolution( $C_{n}^{D}$ )和五个down-convolution( $C_{n}^{U}$ )组成。

D()表示dropout层，Conv3表示3×3的卷积层，每个卷积层都接有一个BN层和一个Leaky ReLU激活函数。

TConv2表示2×2的反卷积层，每个卷积层和反卷积层都接有一个BN层和一个Leaky ReLU激活函数。 $\coprod$ 表示拼接操作。

在这里插入图片描述
y表示GT的标签值，y^表示预测的标签值。
它对目标像素具有很高的不确定性，其中伪装对象检测网络做出了自信但错误的预测。例如，模型预测为0.01，认为是背景，但是GT是1，其最终结果为0.99，表示困难。
在这里插入图片描述
置信度估计网络损失函数。

confidence-aware structure loss：
在这里插入图片描述
流程图：

在这里插入图片描述

关注