arXiv 2021
Bo Dong, Mingchen Zhuge, Yongxiong Wang, Hongbo Bi, Geng Chen
论文地址
一、简介
提出了MIF模块来有效地融合多级特征。其采用交互式注意力机制。
提出了DMC模块,利用多重卷积操作来扩大感受野,为COD任务提供丰富的上下文信息。
提出的MCIF-Net模型使用COD数据集进行广泛实验。
二、方法
2.1 网络架构
如Figure2所示。
- 使用一个backbone网络提取四个尺度的分层信息,由浅到深分别表示为X1、X2、X3和X4,它们缺少丰富的上下文信息,因为它们被限制在了很小的感受野当中;
- 将每个X(i)送入DMC模块。DMC模块能够从一个大的感受野中捕获丰富的上下文信息。公式如下:
- 通过对应元素乘积操作来得到相邻层的特征之间的相关性,从而产生新的特征,公式如下:
- 采用注意力机制(MIF模块)融合不同级别的特征,公式如下:
- 对四个分支都进行了监督学习。其中P(1)为最终结果。
2.2 DMC模块(Dual-branch Mixture Convolution Module)
DMC模块是为了扩大感受野,它是由不对称卷积和扩张卷积组成。
如Figure2所示,首先使用3×3的卷积来粗略转换输入特征。
为了学习具有更大感受野的同等空间大小的特征,将其投射到两个独立的分支,在分支中,1×1的卷积改变通道数,通过一对不对称卷积来放大感受野。
为了最大化两个分支之间的合作,将两个分支得到的输出进行相加操作。
为了进一步扩大感受野,使用扩张卷积。然后将两个分支的输出相加并通过一个3×3的卷积和ReLU激活函数。
2.3 MIF模块(Multi-level Interactive Fusion Module)
使用MIF模块融合DMC模块的丰富的上下文特征。MIF模块使用注意力机制和特征交互来融合多级特征。
CBR为卷积层,BN层和ReLU层。
max和mean分别表示计算每个通道向量的最大值和平均值。σ表示sigmoid激活函数。
2.4 Loss Function
二进制交叉熵损失(BCE)广泛应用于二进制分割,但它仅在浅层像素定义,这存在不平衡的问题。我们注意到训练数据集中的前景像素和背景像素的类别不平衡问题,提出了为每个像素添加一个额外的平衡参数λn。定义如下:
Pn是预测的像素值,Gn是GT的像素值。BCE损失如下:
使用IoU损失关注区域,公式如下:
整体损失: