Segment Anything模型结构解读

Soonki

已于 2023-10-08 16:34:20 修改

阅读量1.7w

点赞数 14

分类专栏： OT论文解读文章标签：人工智能深度学习计算机视觉

于 2023-04-24 21:11:58 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Soonki/article/details/130351335

版权

OT论文解读专栏收录该内容

16 篇文章 2 订阅

订阅专栏

论文地址
 代码下载
 官网

关于Segment Anything的理解

1.人工标注过程

使用公开数据集训练，并且让人工标注团队进行标注预测的mask，该过程总共进行6次，并产生430万个mask

2.半自动标注过程

模型产生的置信度相对较高的mask，不需要人工标注，而置信度相对不高的mask，由人工完成标注。举个例子，模型分割一张图片，总共产生了10个mask，其中有5个分割得很好，这部分就作为自动标注的mask，另外5个效果不好，就进行人工标注。该过程总共进行5次，产生590万个mask

3.全自动过程

让模型完成全自动的标注。通过IoU过滤置信度不高的mask，并且进行去重操作，产生11亿的mask

关于数据集SA-1B

数据集相当大，尝试下载一个tar，大概10个G，压缩包总共可能有10T
SA-1B数据下载

关于网络模型

网络总共有三个部分：image_encoder、prompt_encoder和mask_decoder。个人感觉网络模型还是很大的，下面是细化的网络模型也是代码结构
SAM

image_encoder部分：

image_encoder

prompt_encoder部分：

prompt_encoder

mask_decoder部分：

mask_decoder

关注

14
点赞
踩
31

收藏

觉得还不错? 一键收藏
3
评论
Segment Anything模型结构解读

论文地址代码下载官网关于Segment Anything的理解1.人工标注过程使用公开数据集训练，并且让人工标注团队进行标注预测的mask，该过程总共进行6次，并产生430万个mask2.半自动标注过程模型产生的置信度相对较高的mask，不需要人工标注，而置信度相对不高的mask，由人工完成标注。举个例子，模型分割一张图片，总共产生了10个mask，其中有5个分割得很好，这部分就作为自动标注的mask，另外5个效果不好，就进行人工标注。该过程总共进行5次，产生590万个mask3.全自动过程
复制链接

扫一扫

专栏目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。