U2-Net: Going Deeper with Nested U-Structure for Salient Object Detection
Abstract
简单且强大的深层网络架构(U2-Net架构)
- 两级嵌套的U型结构
- 这种架构使我们能够从头开始训练一个深度网络,而无需使用图像分类任务的主干。
优点
-
在残差U型区块(RSU)中混合了不同大小的感受野
- 可不同的尺度捕捉更多的上下文信息
-
the pooling operations used in these RSU blocks
- 增加了整个架构的深度,而没有显著增加计算成本
代码地址
- https://github.com/xuebinqin/U-2-Net
Introduction
Salient Object Detection (SOD)
- 旨在分割图像中最具视觉吸引力的目标,被广泛应用于如视觉跟踪,图像分割
大多数SOD网络的设计都有一个共同的模式,即他们专注于很好地利用现有主干提取的深层特征(Alexnet VGG ResNet ResNeXt densente)
- 但这些主干都是最初为图像分类而设计的,它们提取代表语义意义的特征,而不是局部细节和全局对比度信息,这对于显著性检测是必不可少的。
解决了两个问题
- First, U2-Net is a two-level nested U-structure that is designed for SOD without using any pre-trained backbones
from image classification. It can be trained from scratch to achieve competitive performance. - Second, the novel architecture allows the network to go deeper, attain high resolution, without significantly increasing