Panoptic-PartFormer:首篇端到端全景部件分割算法,代码已开源!(ECCV2022)

点击下方卡片,关注“自动驾驶之心”公众号

ADAS巨卷干货,即可获取

基于Transformer的第一篇统一端到端全景部件分割算法!代码已开源!

标题:Panoptic-PartFormer: Learning a Unified Model for Panoptic Part Segmentation

链接:https://arxiv.org/pdf/2204.04655v1.pdf

代码:https://github.com/lxtGH/Panoptic-PartFormer

摘要

全景部件分割(PPS)旨在统一全景分割和部件分割。先前的工作主要使用不同的方法来单独处理thing、stuff和part,并未进行任何的计算共享和任务关联。因此本文搭建了一个统一的框架,即Panoptic-PartFormer来实现上述工作。本文在 Cityscapes PPS 和 Pascal Context PPS数据集上取得了最先进的结果,同时减少了70%的计算量和50%的参数量。相比于以往方法,在 Pascal Context PPS 数据集上,ResNet50主干下取得3.4%的提升,使用 Swin Transformer后,获得了10%的性能提升。

贡献

本文的贡献主要有以下几点:

1、Panopic-PartFormer为全景部件分割提供一个新颖、简单且有效的基线算法,据本文所知,这是该任务的第一个统一的端到端模型;

2、本文提出一个新的解耦的解码器和一个联合查询更新和推理框架,用于thing、stuff和part的联合特征学习,此外,提出了一个新的损失函数来监督整个模型;

3、大量的实验和分析表明了Panopic-PartFormer的有效性和泛化性。本文通过联合训练显著改善部件分割的性能。在Pascal Context PPS 数据集上,使用ResNet101的PartPQ增益约6-7%,使用swin Transformer  的 PartPQ 增益约为 10%,在Cityscapes PPS数据集上获得了1-2的PartPQ增益,并在Mapillary 和 BDD数据集上表现出更好的泛化能力。

全景部件分割的示意图如下所示:

080a0b874f1e493a8a9047f014aa0eac.png

方法

下图展示了Panopic-PartFormer的整体结构,主要包含三个部分:

1)Encoder network:用于特征提取的主干网络,常见的主干网络如ResNet、Swin Transformer等。

2)Decoupled decoder:解耦解码器包含两个独立的解码器网络,用来获取scene feature和 part feature,其中scene feature用来对thing和stuff的预测进行解码,而part feature用来对part的预测进行解码。这是因为部件分割和全景分割拥有不同的属性。首先,part feature需要更精确的位置和细节信息,其次,scene feature侧重于mask proposal级别的预测,而part feature则更关注mask proposal的内部部分,两者相互冲突。

3)Transformer decoder:将三种不同类型的query和主干特征作为输入,并输出thing、stuff和part的预测结果。

fda94ff729526187cdd18d66eb7cf142.png

实验结果

Cityscape Panoptic Part 数据集的实验结果:0826e3b0376c20c7554501329e8e5d12.png

计算量和参数量对比:2199974909967d80047ca1c1ef7e0471.png

Pascal Panoptic Part数据集的实验结果:62c0c81e6bea263e40b56c8c4142a660.png

消融实验和模型设计:1b2abfe8bf0e2b32e504dd1f2a672e76.png

不同数据集的可视化结果:ad36c793ba7bc0e76679cbe1ba487d4d.jpeg

自动驾驶之心】全栈技术交流群

自动驾驶之心是首个自动驾驶开发者社区,聚焦目标检测、语义分割、全景分割、实例分割、关键点检测、车道线、目标跟踪、3D感知、多传感器融合、SLAM、高精地图、规划控制、AI模型部署落地等方向;

加入我们:自动驾驶之心技术交流群汇总!

自动驾驶之心【知识星球】

想要了解更多自动驾驶感知(分类、检测、分割、关键点、车道线、3D感知、多传感器融合、目标跟踪)、自动驾驶定位建图(SLAM、高精地图)、自动驾驶规划控制、领域技术方案、AI模型部署落地实战、行业动态、岗位发布,欢迎扫描下方二维码,加入自动驾驶之心知识星球(三天内无条件退款),日常分享论文+代码,这里汇聚行业和学术界大佬,前沿技术方向尽在掌握中,期待交流!

413e132481adc95cc5fc5d4a5f73087d.jpeg

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值