学习遥感大模型（2)---SAM的两种用法(1)

最新推荐文章于 2024-12-17 11:12:21 发布

datamore

最新推荐文章于 2024-12-17 11:12:21 发布

阅读量1.1k

点赞数 3

分类专栏：图像分割对地观测文章标签：学习计算机视觉深度学习人工智能

本文链接：https://blog.csdn.net/weixin_45827311/article/details/133707814

版权

对地观测同时被 2 个专栏收录

4 篇文章

订阅专栏

图像分割

3 篇文章

订阅专栏

RSPrompter: Learning to Prompt for Remote Sensing Instance Segmentation based on Visual Foundation Model

北航、上海人工智能实验室

https://kyanchen.github.io/RSPrompter

0.简介

这篇工作尝试将Meta的SAM迁移到遥感实例分割任务上，需要在遥感数据集上微调；相比SAM交互式的分割（基于不同的Prompt），这篇工作提出自动生成prompt，但是学习到如何自动生成prompt的过程似乎依赖训练数据集，也就是说：模型能识别的类别局限于所有的训练类别。

1.动机：

Segment Anything需要prompt，prompt类型、位置和数量影响SAM效果

SAM缺乏语义信息

2.现有的将SAM应用于实例分割的思路

3.本文的思路

• 基于遥感数据集训练一个“ prompter”

• prompter 能够基于图像特征自动生成顾及语义（类别相关）的 prompt

• 每个 prompt 对应一个实例

针对具体的prompter设计，与Mask-RCNN和DETR的思想相近，作者提出了Anchor-based prompter和query-based-prompter，这里要注意的是：在SAM中我们理解的prompt有点、bbox、文本等具体形式（“显式”prompt），而prompter生成的prompt是一系列向量（“隐式”prompt）