SAM(Segment Anything Model)网络结构

17_ayyy

于 2024-09-24 10:10:49 发布

阅读量375

点赞数 3

文章标签： python 计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_74770505/article/details/142482140

版权

Data engine

自动生成大量的数据集

三个阶段

assisted-manual：公开数据集中，可能识别了部分，然后人工标注剩余物品

semi-automatic：利用物体检测+识别效果不好，手工标注

fully-automatic：全自动标注，标注一些重写训练，标注一些重新训练

网络架构

Image_encoder ——Vision Transformer(ViT)

Vison Transformer：特征提取enconder

将一个输入图片进行特征提取，然后输出特征向量，供后续进行处理

解决数据量大，然后输入全部的图像矩阵，从而带来的计算难度的问题

使用的何凯明大神，训练的一个ViT预训练模型MAE

Prompt encoder——用于快速人机交互

Prompts：
- kind
  - Sparse（稀疏的）：points（点），box（框），free-form text（文本）
  - dense（紧密的）：mask（多点围成的区域）
- disposed
  - points、box、mask做编码很容易
  - text encoder 用的是CLIP—自然语言处理相关的

Mask decoder——maskformer

 The mask decoder efficiently maps the image embedding,prompt embeddings,and an output token to a mask

采用原有技术

Transformer decoder block
dynamic mask prediction head——maskformer

改进优化

prompt self-attention 提示文本自注意力机制 Transformer
cross-attention 交叉注意力机制
- prompt-to-image/image-to-prompt

后续是经历一个MLP（多层感知机、全连接神经网络），然后计算损失

关注

3
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

博客等级

码龄2年

10
原创

147
点赞

133
收藏

126
粉丝

关注

私信

热门文章

分类专栏

python 1篇

最新评论

机器学习-交叉验证Cross-Validation
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
Python中列表的应用（实现C语言中的数组，矩阵的转置，跟随排序，动态规划法TSP问题代码）
CSDN-Ada助手: 恭喜您写了这么一篇涵盖了Python中列表多种应用的博客！看到您实现了C语言中数组、矩阵的转置，跟随排序以及动态规划法TSP问题代码，真是让人佩服不已。希望您能继续保持创作的热情，不断分享您的学习心得和经验。或许下一步可以尝试探索更多Python中列表的高级应用，或者结合其他语言的特性进行比较与总结，相信会有更多精彩的内容等着我们！期待您的下一篇作品。
Python跟随排序（两个list元素一一对应，一个list进行排序，另一个list上的元素也跟着排序，保持一一对应关系）
CSDN-Ada助手: 恭喜您写了这篇关于Python跟随排序的博客！这是一个非常实用的技巧，能够帮助大家更好地处理数据。接下来，我建议您可以尝试分享一些更加高级的排序算法或者数据处理技巧，让读者们能够进一步提升他们的编程能力。希望您能继续保持创作的热情，为大家带来更多有用的知识！
Python中列表的应用（实现C语言中的数组，矩阵的转置，跟随排序，动态规划法TSP问题代码）
普通网友: 写的很好，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
如何使用labelimg标注自己的数据集，并实现多人同时标注，及常见的labelimg闪退问题
CSDN-Ada助手: 恭喜你发布了第四篇博客！看到你分享如何使用labelimg标注数据集并实现多人同时标注的方法，以及解决常见的labelimg闪退问题，让我受益匪浅。希望你能继续坚持创作，不断分享更多有价值的内容。下一步，我建议你可以探讨如何优化标注效率，或者分享一些实用的数据集处理技巧。期待看到你的新作品！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。