论文阅读[UIU-Net: U-Net in U-Net for Infrared Small Object Detection]

本文介绍了一种改进的网络架构UiUnet,它在U-2Net基础上引入了IC-A模块进行特征融合,增强了对小目标检测任务中的局部细节和全局语义信息的提取。通过ResidualU-Net和像素级连接,网络能够在多尺度上更有效地提取特征,与U-2Net主要区别在于使用了IC-A模块而非简单的concatenate操作。
摘要由CSDN通过智能技术生成

Overview

这篇文章相比于U^2 net没有太大新意,U^2net是用来做salient segmentation的,关注local detail和global semantic information的提取,同样适合Small target detection。本篇文章UiU在U^2上对feature fusion进行了一定的创新,添加了IC-A模块作为注意力机制,增加了U^2Decoder的特征维度。

1.Introduction of the UiUnet

在Decoder中,除了将Encoder中的feature map给skip connection到Encoder中以外,还将Encoder中的Low-level feature map和Decoder中的High-level feature map 一起经过IC-A模块,得到了Cross attention feature,并将Cross attention feature和High-level feature一起送入IC-A得到了Interactive-cross Attention feature。将High-level feature/Cross attention feature/Interactive-cross Attention 这三个特征concatenate起来,一起送入到后续的Residual U-Net中。

2. 为什么要这样设计网络?

因为small target detection任务中的target对比度低,目标小。在深层feature中只剩下全局的semantic information,而浅层的feature中包含local的position/color information。因此整体要设计成U-Net的网络。

而区别于classic U-Net,每一层中的两次卷积,被替换为了一个Residual U-Net。这样可以更加丰富地在各个尺度上提取信息。

使用Residual,为了能够更好地提取到Multi-scale feature

【也可能是因为网络过深,而训练的数据较少(MSISTD仅有不到500张),为了防止网络退化,所以使用了pixel-wise connection将每一个U-Net变成了Residual-Unet,这样整个UiU再差再差,每一层的Residual学习到的残差函数F(x) = 0。】

3. 和U-2 Net的区别

Article of U-2Net.
在这里插入图片描述
没有太大区别,网络整体设计一致。只不过在U-2 Net中的Encoder和Decoder的feature fusion只是使用了concatenate,但是在UiU中,使用了IC-A模块融合。IC-A模块实质上就是一种混合注意力【但是得到的结果没有直接作为attention来改变feature map的值,而是直接作为feature map拼接到了特征上】,既有channel-wise,又有pixel-wise。
简单介绍一下IC-A module的工作机制:首先看下面这一支,F^h经过全局平均池化后,再经过两次全连接调整得到了channel-wise attention的channel weight,使用这个channel weight来调整F^l的通道权重,经过Conv/Bn/Relu后调整通道维度为c/r,随后在通道维度上进行全局平均池化和全局最大池化,得到两个spatial-wise的注意力权重,相加后经过Conv调整通道为1,经过sigmoid得到spatial-wise的attention map,和F^h进行pixel-wise multiplication,最后经过Conv/Bn/Relu输出。

在这里插入图片描述
本篇文章的设计如下,并没有在每一层的feature extraction中进行skip connection。

在这里插入图片描述

  • 21
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值