SegPrompt：引入Prompt learning提升开放世界分割的能力

最新推荐文章于 2024-07-13 15:10:22 发布

温华梦

最新推荐文章于 2024-07-13 15:10:22 发布

阅读量165

点赞数

文章标签： prompt 深度学习图像处理人工智能

本文链接：https://blog.csdn.net/qq_43514509/article/details/132454447

版权

SegPrompt：引入Prompt learning提升开放世界分割的能力

在这里插入图片描述
这篇文章是由浙大和阿德莱德大学合作，在2023.8.12上传到arxiv上的文章，创新性强，解决的问题也非常有挑战性，值得一读。

背景

之前Open-World Entity Segmentation这篇文章提出了实体分割的概念,只注重分割对象的质量，而不关注对象的类别，在Photoshop这类图像编辑的软件中有着很好的用处。但是对于open-world instance segmentation这个任务来说还远远不够，需要解决在开放世界中未见过的物体分割，以及对分割的物体生成标签。

为此，本文提出了包含Prompt learning机制的分割网络，在保持分割能力的同时，运用到类别信息。

本文的贡献

引入Prompt learning机制，它有效地使用类别信息来改进分割结果
第一个关注开放世界分割中的长尾效应
类别级的提示信息确实能够提升分割质量，能扩展到少样本的分割

文中将物体分为Known（训练集中有标注）、Seen （训练集中无标注，测试集有标签，看到了但不知道是啥）、Unseen（训练集没出现过，测试集中有标注，开放世界分割较常出现的问题）

方法

总览

在这里插入图片描述
模型主要为三个分支，Prompt Extraction Branch，Prompt-based Prediction Branch， Class-agnostic Branch。Prompt Extraction Branch以提示的形式提供类别级实例特性，然后Prompt-based Prediction Branch使用这些提示来预测相应的每类实例掩码，除了少数与提示相关的嵌入外，所有参数都与类别无关的分割网络共享。