【读论文-01】EfficientSAM: Leveraged Masked Image Pretraining for Efficient Segment Anything

最新推荐文章于 2024-08-26 21:30:29 发布

SinHao22

最新推荐文章于 2024-08-26 21:30:29 发布

阅读量517

点赞数 8

文章标签： SAM CVPR2024 论文速览

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44166630/article/details/136400235

版权

本文介绍了如何通过将SAM的ImageEncoder由ViT-H替换为轻量级的ViT-Small/Tiny，并采用知识蒸馏技术进行预训练和微调，以实现EfficientSAM，降低计算量和参数。

摘要由CSDN通过智能技术生成

在这里插入图片描述

1. 做了什么？

在这里插入图片描述
把SAM变成了更计算高效、参数更少的EfficientSAM。

2. 具体怎么做的？

2.1 模型结构

从模型结构上来看：把SAM中的Image Encoder由ViT-H变成ViT-Small/Tiny。

下面是SAM的结构，可以看到Image Encoder很庞大，这也是SAM推理低效的原因。
在这里插入图片描述
图片来源：Sagment Anything
EfficientSAM的结构就是image encoder更加轻量化的SAM：

2.2. 如何训练Efficient SAM？

再进一步：lightweight image encoder如何训练？

具体framework如下：

在这里插入图片描述
可以看到分为两个阶段：预训练阶段（stage-1）和微调阶段（stage-2）

stage-1：（训练数据集为ImageNet-1K）

Masked Auto Encoder（MAE）的掩码学习训练策略；
知识蒸馏，让EfficientSAM的lightweight image encoder去学习SAM的image encoder的latent feature。

stage-2：（训练数据集为SA-1B）

使用SA-1B在Segment Anything上微调。

3. 个人看法

EfficientSAM本质在做这么一件事：通过知识蒸馏，将SAM中的Image Encoder由ViT-H变为ViT-Tiny/Small，进而减少计算量和参数量。

关注

8
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
0
评论
【读论文-01】EfficientSAM: Leveraged Masked Image Pretraining for Efficient Segment Anything

EfficientSAM本质在做这么一件事：通过知识蒸馏，将SAM中的Image Encoder由ViT-H变为ViT-Tiny/Small，进而减少计算量和参数量。
复制链接

扫一扫

SinHao22 CSDN认证博客专家 CSDN认证企业博客

码龄6年

101: 原创

4048: 周排名

2万+: 总排名

54万+: 访问

: 等级

3777: 积分

4万+: 粉丝

1251: 获赞

386: 评论

6106: 收藏

私信

关注

热门文章

分类专栏

最新评论

【ViT 微调时关于position embedding如何插值（interpolate）的详解】
hhoi: 讲的太好了，一下子就看懂了
【细碎知识2】定点数的乘除运算（原码一位乘、恢复余数法、加减交替法）
做而论道_CS: X=0.625, Y=0.8125, X/Y=0.75, 余1/64。－－－－－－－－－－－－－－－－－－你是怎么得出 0.75 呢？因为，你在 X 后面添上了 0 ！你为什么要在后面添上 0 呢？你这么做，毫无理由。假如可以添 0，你为什么不继续添呢？你为什么剩下一个余数，不继续往下除了呢？你不继续添 0，也是毫无理由的。－－－－－－－－－－－－－－－－你再看看我一开始的评论吧。零，应该添多少？没有标准，就没有正确答案！你不用拿十进制来给我解释。你解释不出来 “应该除到什么时候”。你的答案，也不是最准确的。如果再添一个 0，继续除下去，那么，你写的这个答案，也是错的。你的理解，显然就是学了没头没脑的课程的思维。学过了计算机，手表，都不认识了吧？
【细碎知识2】定点数的乘除运算（原码一位乘、恢复余数法、加减交替法）
weixin_58708308: X=0.625,Y=0.8125,X/Y=0.75,余1/64,而你余0.625,转化为十进制计算能帮你好理解一点吗？
【细碎知识2】定点数的乘除运算（原码一位乘、恢复余数法、加减交替法）
做而论道_CS: 私信聊？没兴趣。
【细碎知识2】定点数的乘除运算（原码一位乘、恢复余数法、加减交替法）
做而论道_CS: 你的余数是0.1010，该情况下正确的余数是0.00000100 －－－－－－－－－－－－－－你跟体育老师学的算术吧？因为：X < Y。 X / Y，显然就不够除，商，必然是 0。余数，肯定就是 0.1010。你验算一下：　被除数 = 商 × 除数 + 余数。你说余数是 0.0000 0100？你能得出被除数 (0.1010) 吗？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

SinHao22 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。