【Segment Anything Model】三：SAM模型微调自定义数据集，更改混合提示方式：点，框，点框混合

cv夏一笑

已于 2023-09-14 10:29:42 修改

阅读量6.9k

点赞数 77

分类专栏： seg模型文章标签： python 计算机视觉

于 2023-08-04 00:00:53 首次发布

不能转载

本文链接：https://blog.csdn.net/cvxiayixiao/article/details/131273595

版权

seg模型专栏收录该内容

13 篇文章 146 订阅 ¥49.90 ¥99.00

订阅专栏

超级会员免费看

本文介绍了如何微调Segment Anything Model (SAM) 使用点、框、点框混合提示，并针对自定义数据集进行适配。内容包括SAM的结构、微调策略、环境配置、代码框架、提示输入维度要求以及数据预处理方法。作者提供了代码示例并强调只微调解码器的可行性。

摘要由CSDN通过智能技术生成

文章目录

1.微调SAM预备知识
2.环境
3.用自己的数据集微调SAM，适配自己的下游任务
1.点框结合提示，框架代码
2.sam要求的提示输入维度
3.自定义数据集预处理数据打包成模型需要的形式
** 主要是我昨天答应了一个评论说今天更新，眼看快12点了，我得发了。后续再说吧。其实该说的也说完了。有错误明天在更正哦，好困好困 🫡

点击订阅专栏查看专栏列表和对应知识点，本文为seg SAM系列文章，在持续更新。

（题外话：如果是关注的小伙伴应该能发现我断更了一段时间，首先对不起，终究是因为一些私事影响了更新计划，我很抱歉。不过，现在我已整理好情绪，好山常在水长流，永远相信下一次，不管烟波与风雨，永远期待下一次。再次出发吧！）

1.微调SAM预备知识

基础理论参照上两篇。Segment Anything Model分为三部分，图像编码器，提示编码器，和解码器，图像编码和提示编码器相加输入到解码器中，解码器获得mask和iou输出。

我们在其模型上微调可以选择全部权重都调整或者只微调解码器。根据一些论文，表示，全部微调收益不大，同时，我自己全部微调的时候用的是48GB的A40，2080ti带不起来的，但只微调解码器 22GB的2080ti可以。

对于其预训练模型权重，我们使用vit_b最基础的权重，原论文说采用全部数据训练的预训练权重vit_h效果有提升但是不大。
所以，我们之下的代码基于，使用四种提示方式（单点，多点，单框，点框结合）来微调SAM的解码器。

概况为：使用from segment_anything import sam_model_registry 注册模型，例如sam_model = s

了解本专栏

超级会员免费看

关注

77
点赞
踩
94

收藏

觉得还不错? 一键收藏
打赏
98
评论
【Segment Anything Model】三：SAM模型微调自定义数据集，更改混合提示方式：点，框，点框混合

1.微调SAM预备知识。
复制链接

扫一扫

专栏目录

评论 98

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

cv夏一笑 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。