【ZoomNet】Zoom In and Out: A Mixed-scale Triplet Network for Camouflaged Object Detection

Zoom In and Out: A Mixed-scale Triplet Network for Camouflaged Object Detection

Abstract

  作者受到人类在观察模糊图像会放大和缩小行为的启发,设计了一种混合尺度的三重网络ZoomNet。
  ZoomNet采用Zoom策略,通过设计尺度集成单元分层混合尺度单元学习判别混合尺度语义,挖掘候选对象与背景环境之间的不可察觉的线索。
  此外,考虑到不可区分纹理的不确定性和模糊性,ZoomNet构建了一个简单而有效的正则化约束,即不确定性感知损失,促进模型在候选区域准确地产生更高置信度的预测。
image.png

Structure

image.png
  ZoomNet使用共享的triplet特征编码器提取不同尺度的特征。然后使用尺度融合单元SMLattention-aware filtering机制下,融合这些特征。接着ZoomNet使用分层混合尺度单元HMUs以自上而下的方式逐步融合多尺度特征表示。除此之外,ZoomNet也使用了一种不确定损失(UAL)去协助BCE损失。

Scale Merging Layer

image.png
  如公式所示,该层的主要工作是将0.5尺度下的特征进行双线性差值操作,将1.5尺度下的特征进行混合池化操作。然后,对这三组特征进行连接。最后经过一系列的Conv-BN-ReLU层和一个softmax层激活后获得每个特征的注意力图。最终的融合是将不同尺度的特征进行加权相加。
image.png

Hierarchical Mixed-scale Decoder

image.png
  分层混合尺度解码器主要用来融合不同channels的特征。分层混合尺度解码器会融合尺度融合层的特征和上一个分层混合尺度解码器的特征。
image.png

Group-wise Iteration

  ZoomNet使用1×1的卷积去扩展特征图的通道数。然后将这些特征分成G个group,将gi分成三个gi,将后两个gi用来channel-wise modulation,第一个gi与gi+1进行连接,实现信息交换。

Channel-wise Modulation

image.png
  ZoomNet会连接g’2接着会转换成特征调制向量α,α会对g’3连接成的特征进行加权,然后经过一个卷积层,再与fi连接,最后经过一个激活层。

Loss Functions

  伪装物体检测只使用BCEL时,会在预测的时候,产生严重的模糊性和不确定性,降低COD的可靠性。ZoomNet为了迫使模型增加决策的置信度,增加了对模糊预测的惩罚,设计了一个强约束的不确定感知损失作为BCEL的辅助函数。
image.png
  不确定感知损失LUAL = 1 - | 2pi,j - 1 |2,模型的总损失函数可以表示为:
  L = LBCEL + λ×LUAL

Summary

  ZoomNet的主要思想是融合不同尺度的特征来让模型学习到图片中的关键线索,思想很像是特征金字塔。

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

CRE_MO

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值