【Segment Anything Model】三:SAM模型微调自定义数据集,更改混合提示方式:点,框,点框混合

本文介绍了如何微调Segment Anything Model (SAM) 使用点、框、点框混合提示,并针对自定义数据集进行适配。内容包括SAM的结构、微调策略、环境配置、代码框架、提示输入维度要求以及数据预处理方法。作者提供了代码示例并强调只微调解码器的可行性。
摘要由CSDN通过智能技术生成


点击订阅专栏查看专栏列表和对应知识点,本文为seg SAM系列文章,在持续更新。

(题外话:如果是关注的小伙伴应该能发现我断更了一段时间,首先对不起,终究是因为一些私事影响了更新计划,我很抱歉。不过,现在我已整理好情绪,好山常在水长流,永远相信下一次,不管烟波与风雨,永远期待下一次。再次出发吧!)

1.微调SAM预备知识

基础理论参照上两篇。Segment Anything Model分为三部分,图像编码器,提示编码器,和解码器,图像编码和提示编码器相加输入到解码器中,解码器获得mask和iou输出。

我们在其模型上微调可以选择全部权重都调整或者只微调解码器。根据一些论文,表示,全部微调收益不大,同时,我自己全部微调的时候用的是48GB的A40,2080ti带不起来的,但只微调解码器 22GB的2080ti可以。

对于其预训练模型权重,我们使用vit_b最基础的权重,原论文说采用全部数据训练的预训练权重vit_h效果有提升但是不大。
所以,我们之下的代码基于,使用四种提示方式(单点,多点,单框,点框结合)来微调SAM的解码器。

概况为:使用from segment_anything import sam_model_registry 注册模型,例如sam_model = s

  • 77
    点赞
  • 94
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 98
    评论
评论 98
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

cv夏一笑

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值