Towards Accurate Camouflaged Object Detection with Mixture Convolution and Interactive Fusion阅读笔记

arXiv 2021
Bo Dong, Mingchen Zhuge, Yongxiong Wang, Hongbo Bi, Geng Chen
论文地址

一、简介

提出了MIF模块来有效地融合多级特征。其采用交互式注意力机制。

提出了DMC模块,利用多重卷积操作来扩大感受野,为COD任务提供丰富的上下文信息。

提出的MCIF-Net模型使用COD数据集进行广泛实验。

二、方法

在这里插入图片描述

2.1 网络架构

如Figure2所示。

  1. 使用一个backbone网络提取四个尺度的分层信息,由浅到深分别表示为X1、X2、X3和X4,它们缺少丰富的上下文信息,因为它们被限制在了很小的感受野当中;
  2. 将每个X(i)送入DMC模块。DMC模块能够从一个大的感受野中捕获丰富的上下文信息。公式如下:
    在这里插入图片描述
  3. 通过对应元素乘积操作来得到相邻层的特征之间的相关性,从而产生新的特征,公式如下:
    在这里插入图片描述
  4. 采用注意力机制(MIF模块)融合不同级别的特征,公式如下:
    在这里插入图片描述
  5. 对四个分支都进行了监督学习。其中P(1)为最终结果。

2.2 DMC模块(Dual-branch Mixture Convolution Module)

DMC模块是为了扩大感受野,它是由不对称卷积和扩张卷积组成。

如Figure2所示,首先使用3×3的卷积来粗略转换输入特征。

为了学习具有更大感受野的同等空间大小的特征,将其投射到两个独立的分支,在分支中,1×1的卷积改变通道数,通过一对不对称卷积来放大感受野。

为了最大化两个分支之间的合作,将两个分支得到的输出进行相加操作。

为了进一步扩大感受野,使用扩张卷积。然后将两个分支的输出相加并通过一个3×3的卷积和ReLU激活函数。

在这里插入图片描述
在这里插入图片描述

2.3 MIF模块(Multi-level Interactive Fusion Module)

在这里插入图片描述

使用MIF模块融合DMC模块的丰富的上下文特征。MIF模块使用注意力机制和特征交互来融合多级特征。

CBR为卷积层,BN层和ReLU层。

在这里插入图片描述

max和mean分别表示计算每个通道向量的最大值和平均值。σ表示sigmoid激活函数。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2.4 Loss Function

二进制交叉熵损失(BCE)广泛应用于二进制分割,但它仅在浅层像素定义,这存在不平衡的问题。我们注意到训练数据集中的前景像素和背景像素的类别不平衡问题,提出了为每个像素添加一个额外的平衡参数λn。定义如下:

在这里插入图片描述

Pn是预测的像素值,Gn是GT的像素值。BCE损失如下:

在这里插入图片描述

使用IoU损失关注区域,公式如下:

在这里插入图片描述

整体损失:

在这里插入图片描述

三、实验

在这里插入图片描述

在这里插入图片描述

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Ma lidong

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值