文章 | 中文题目 | 摘要 |
Learning a Discriminative Feature Network for Semantic Segmentation(DFN) | 学习用于语义分割的判别特征网络(DFN) | 网络结构见图2,所谓“descriminative Feature”指从不同通道中找到更具判别能力的特征 Smooth Network:增强同类像素一致性(高层特征指导低层特征,计算通道权值CAB); Border Network:增强语义边界部分的响应; |
BiSeNet - Bilateral Segmentation Network for Real-time Semantic Segmentation | 用于实时语义分割的双边分割网络 | 速度可达实时(Table5)。网络结构如图2,共两路: 空间路:步长小,保细节; Context Path:步长大,扩大视野。 最后两路融合(FFM) |
LadderNet - Multi-Path Networks Based on U-NET for Mediacal Image Segmentation | 基于U-NET的多路径网络在医学图像分割中的应用 | 多个U-Net串起来,像个“梯子”,如图1。 用于医学图像分割 |
Dual Attention Network for Scene Segmentation(DANet) | 用于场景分割的双注意网络(DANet) | 双Attention:空间和通道(Channel)。Dilation FCN基础上改进 |
Attention U-Net - Learning Where to Look for the Pancreas | 注意力U-Net —— 学习在哪里寻找胰腺 | U-Net网络中加入Attention Gate,实现粗尺度指导细尺度特征的refine。用于医学图像分割 |
Recurrent Residual Convolutional Neural Network based on U-Net (R2U-Net) for Medical Image Segmentation | R2U-Net——基于U-Net的递归残差卷积神经网络在医学图像分割中的应用 | U-Net中采用循环残差层替换原来的卷积层。用于医学图像分割 |
Understanding Convolution for Semantic Segmentation | 理解卷积在语义分割中的应用 | 1. DUC:密集上采样 2. HDC:混合扩张卷积 图2 |
Learning to Adapt Structured Output Space for Semantic Segmentation | 基于结构化输出空间的语义分割学习 | 语义分割领域基于GAN的域自适应问题(源样本与目标样本来自不同域,但景物内容相似,且源图像有gt,而target没有) 这个方法解决了gt过少的问题(可以采用相似的图像进行训练,而不必每个样本都有gt) |
ShuffleSeg - Real-Time Semantic Segmentation Network | ShuffleSeg——实时语义分割网络 | 基于ShuffleNet,网络结构如图1。由于ShuffleNet属于轻量级网络,因此可以实现实时 |
ESPNet - Efficient Spatial Pyramid of Dilated Convolutions for Semantic Segmentation | 空洞卷积空间金字塔用于语义分割 | 如图1,将普通卷积分解为1x1卷积和空间金字塔融合卷积两步 |
CCNet - Criss-Cross Attention for Semantic Segmentation | CCNet——十字交叉注意力语义分割 | 如图1,采用十字方式分布处理,可以获得空间更远距离的信息(Context Info),同时参数量降低。 |
DenseASPP for Semantic Segmentation in Street Scenes | DenseASPP在街道场景语义分割中的应用 | 密集ASPP(ASPP:空洞空间金字塔池化,不同rate的空洞卷积,DeepLabv3采用的技术),如图2 |
RefineNet - Multi-Path Refinement Networks for High-Resolution Semantic Segmentation | RefineNet——用于高分辨率语义分割的多径细化网络 | 如图2,利用低层(高分辨率)的特征来refine高层(低分辨率)的特征,最终利用softmax来进行像素级的分类。文中的refine模块采用了残差模块 |
Pyramid Scene Parsing Network(PSPNet) | 金字塔场景分析网络(PSPNet) | 金字塔场景分析,如图3。采用不同尺度的池化可以处理不同分辨率的物体,最后上采样后融合,再进行语义(场景)分割 |
Large Kernel Matters - Improve Semantic Segmentation by Global Convolutional Network(GCNet) | 大核问题——用全局卷积网络改进语义分割(GCNet) | 网络结构见图2,语义分割需要尽量多的Context信息,这就需要大的卷积核(GCN),而大的卷积核会造成计算复杂度提高,因而,文中采用分两步计算的方法(图2,B)。同时在网络中添加边缘refine模块 整个结构由FCN发展而来 |
DeepLab - Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs | DeepLab——使用深度卷积网、空洞卷积和全连接CRF的语义图像分割 | DeepLab-1,ASPP(不同rate的空洞卷积)+ 全连接CRF |
Rethinking Atrous Convolution for Semantic Image Segmentation | DeepLab-3——语义图像分割中空洞卷积的再思考 | DeepLab-3,去掉全连接CRF |
Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation | DeepLab-3+——用于语义图像分割的可分离空洞卷积编码解码器 | DeepLab-3+:https://github.com/tensorflow/models/tree/master/research/deeplab 1. DeepLab-3的基础上添加编解码结构 2. 添加Xception model |
CVPR2019 | ||
Co-Occurrent Features in Semantic Segmentation | 语义分割中的共现特征 | 考虑的语义分割中不同语义之间的关系(共现:Co-occurrent,图3),实际上是考虑不同位置之间的点积信息 |
Knowledge Adaptation for Efficient Semantic Segmentation | 有效语义分割的知识自适应 | 基于知识蒸馏的方法(利用复杂的teacherNet指导简单的studentNet,从而得到更快速、效果更佳的推断),实现语义分割 |
All About Structure: Adapting Structural Information Across Domains for Boosting Semantic Segmentation | 关于结构:跨域调整结构信息以推进语义分割 | 文章认为高层结构特征是域不变的,而低层纹理特征是域变化的。如图2,采用编解码结构,将结构特征与纹理特征分离,利用域不变的结构特征训练语义分割网络。定义了相对应的一组损失函数 |
Structured Knowledge Distillation for Semantic Segmentation | 基于结构化知识蒸馏的语义分割 | 结合三类知识蒸馏方法(像素级、像素对级和整体级),实现由复杂网络到简单网络的知识蒸馏 |
Geometry-Aware Distillation for Indoor Semantic Segmentation | 用于室内语义分割的几何感知蒸馏 | 1. 所谓“几何”,在此是“深度”的意思 2. 本文算法即将深度和语义分割同时进行,而语义分割采用的是带深度的pipeline。 3. 训练集是带有深度的RGB图像 |
Context-Reinforced Semantic Segmentation | 上下文强化的语义分割 | 利用上下文来提升语义分割效果,而上下文与分割结果之间,利用强化学习来相互增强。如图2 |
Bidirectional Learning for Domain Adaptation of Semantic Segmentation | 基于域自适应双向学习的语义分割 | 基于域自适应弱监督语义分割:两个子网(有标签的源到无标签目标的translate网,及目标域的语义分割网),传统的方法是先从源到目标,再训练。本文方法是translate与分割两个子网之间双向训练(影响) |
Building Detail-Sensitive Semantic Segmentation Networks With Polynomial Pooling | 基于多项式池化的细节敏感语义分割网络的构建 | 提出了一个(适用于语义分割)的,介于平均池化和最大池化之间的多项式池化(公式1),并对其进行分析和实验 |
Adaptive Pyramid Context Network for Semantic Segmentation | 用于语义分割的自适应金字塔上下文网络 | 研究Content信息在语义分割中的作用,指出context信息的使用应满足三个特点:1. 多尺度;2. 自适应;3. 全局引导局部Affinity(两两相关),并提出ACM(自适应Context模块,见图2),从中可见,多尺度、自适应(体现在其Affinity矩阵是学习而来的),全局引导局部Affinity(矩阵相乘) |
Semantic Projection Network for Zero- and Few-Label Semantic Segmentation | 零标签和少标签语义分割的语义投影网络 | 零镜头或少镜头的语义分割,网络结构如图2 |
Fast Neural Architecture Search of Compact Semantic Segmentation Models via Auxiliary Cells | 基于辅助单元的紧凑语义分割模型的快速神经结构搜索 | 用于语义分割的神经网络结构搜索方法(图1) |
DFANet: Deep Feature Aggregation for Real-Time Semantic Segmentation | 面向实时语义分割的深度特征聚合 | 网络结构如图3,分为子网络特征聚合和子阶段特征聚合(如图2),速度比较快(100FPS) |
A Cross-Season Correspondence Dataset for Robust Semantic Segmentation | 一种鲁棒语义分割的跨季节对应数据集 | 相同场景,不同季节的数据集,如图2,每对图像创建对应点 |
Customizable Architecture Search for Semantic Segmentation | 基于可定制体系结构搜索的语义分割 | 强调可定制,即用户输入条件(限制),搜索满足用户条件的轻量级的网络结构。其条件(限制)体现在自定义的损失函数中。 |
ICCV2019 | ||
Asymmetric Non-Local Neural Networks for Semantic Segmentation | 非对称非局部神经网络用于语义分割 | 语义分割网中嵌入NonLocal-Block,并将其改进为非对称NonLocal-Block,并进一步添加金字塔池化和多级融合技术(见框图) |
CCNet: Criss-Cross Attention for Semantic Segmentation | CCNet:基于交叉注意的语义分割 | 利用十字(criss-cross)方式,高效地获取全局上下文信息 |
SSF-DAN: Separated Semantic Feature Based Domain Adaptation Network for Semantic Segmentation | SSF-DAN:基于分离语义特征的域自适应实现语义分割 | (待标签的)训练样本与真实域无标签训练样本在不同域,因此采用域自适应的方法,来实现弱监督的语义分割。本文采用GAN的方法,如图2 |
Domain Adaptation for Semantic Segmentation With Maximum Squares Loss | 基于最大平方损失的域自适应实现语义分割 | 基于域自适应的语义分割,提出两点改进:1. 提出新的损失函数;2. 提出类别重加权,以解决类别不平衡的问题 |
ACE: Adapting to Changing Environments for Semantic Segmentation | ACE:适应不断变化的环境实现语义分割 | 基于域自适应的语义分割 |
Dynamic Multi-Scale Filters for Semantic Segmentation | 用于语义分割的动态多尺度滤波器 | 如图2,网络中添加多个个基于自适应池化学习出来的滤波器 |
Orientation-Aware Semantic Segmentation on Icosahedron Spheres | 二十面体球面上的方向感知语义分割 | 全方向(omnidirectional)图像的语义分割 |
Towards Bridging Semantic Gap to Improve Semantic Segmentation | 通过桥接语义鸿沟实现语义分割改进 | 文章关注不同尺度特征的融合问题,在图6的网络结构中,使用了图4的三个模块,主要从多尺度融合和边缘感知两个方向,提升语义分割的效果 |
Expectation-Maximization Attention Networks for Semantic Segmentation | 基于期望最大化注意力网络的语义分割 | 如图2,将EM算法的思想和迭代过程,嵌入到深度网络中,目的是替代自监督Attention过程(无需访问所有数据,较Non-Local更为灵活,且可以提升速度) |
Guided Curriculum Model Adaptation and Uncertainty-Aware Evaluation for Semantic Nighttime Image Segmentation | 基于引导课程模型自适应和不确定性感知评价的夜间图像语义分割 | 课程学习、自适应、夜间图像的语义分割 |
Joint Learning of Saliency Detection and Weakly Supervised Semantic Segmentation | 显著性检测与弱监督语义分割的联合学习 | 弱监督语义分割:输入两类训练集(像素级显著性训练集和类别级分类训练集),训练后的像素级语义分割 |
ACFNet: Attentional Class Feature Network for Semantic Segmentation | ACFNet:基于注意力类特征网络的语义分割 | 一种利用类别特征进行语义分割refine的方法,如图2,3。 在粗粒度的语义分割基础上,提取不同类别的特征,进一步由不同类别的特征,对骨干网提出的特征进行Attention,并在此基础上refine |
Significance-Aware Information Bottleneck for Domain Adaptive Semantic Segmentation | 基于重要性感知信息Bottleneck的域自适应语义分割 | 基于GAN的域自适应语义分割的改进,对潜变量进行重要性感知的限制(如图2,3) |
Constructing Self-Motivated Pyramid Curriculums for Cross-Domain Semantic Segmentation: A Non-Adversarial Approach | 基于自我激励金字塔课程的跨域语义分割:一种非对抗性方法 | 课程学习:基于局部分布 自我激励:基于潜变量 本文将两种方式结合起来,并结合金字塔技术,实现域自适应的语义分割 |