arXiv 2021
Jiawei Liu, Jing Zhang, Nick Barnes
论文地址
一、简介
提出了一个置信度感知伪装对象检测框架,该框架具有相互依赖的伪装对象检测网络和置信度估计网络,为难度感知学习提供相互指导;
提出了一种动态置信度监督,它使用伪装对象检测网络的预测与真实标签之间的差异来训练置信度估计网络,然后输出像素级置信度,显示真阴性和假阳性预测防止网络变得过于自信;
我们的置信估计网络可以在不依赖于真实情况的情况下提供对预测的初步评估,实验结果表明我们的方法与最先进的方法相比具有优势。
二、方法
2.1 简介
CANet网络主要包含两个主要模块:1)用于生成伪装maps的伪装对象检测网络(COD Network);2)用于估计当前预测的置信度的置信度估计网络(Confidence Network)。
2.2 COD Network
- 使用ResNet-50作为backbone提取特征( F i ( i = 1 , 2 , . . . , 5 ) F_{i}(i=1,2,...,5) Fi(i=1,2,...,5))。
- 如Figure3所示,设计了Fusion Module (FM) 模块来融合高级信息与低级信息。F2特征在融合中提供更多的空间信息,这对于恢复更清晰的结构是有用的。
- 通过Hollistic Attention Module(HA)来得到F6特征。F7和F8通过残差块得到。
2.3 Confidence Network
- 如Figure2所示,置信度估计网络采用UNet结构来获得像素精确的置信度预测,由五个up-convolution(
C
n
D
C_{n}^{D}
CnD)和五个down-convolution(
C
n
U
C_{n}^{U}
CnU)组成。
D()表示dropout层,Conv3表示3×3的卷积层,每个卷积层都接有一个BN层和一个Leaky ReLU激活函数。
TConv2表示2×2的反卷积层,每个卷积层和反卷积层都接有一个BN层和一个Leaky ReLU激活函数。 ∐ \coprod ∐表示拼接操作。
2.4 动态置信度监督
y表示GT的标签值,y^表示预测的标签值。
它对目标像素具有很高的不确定性,其中伪装对象检测网络做出了自信但错误的预测。例如,模型预测为0.01,认为是背景,但是GT是1,其最终结果为0.99,表示困难。
置信度估计网络损失函数。
2.5 置信度感知学习
confidence-aware structure loss:
流程图:
三、实验