延续SAM-Adapter的成功,魔芯科技、科大等提出SAM2-Adapter,让SAM2实现下游任务SOTA!...

关注公众号,发现CV技术之美

本篇分享论文SAM2-Adapter: Evaluating & Adapting Segment Anything 2 in Downstream Tasks: Camouflage, Shadow, Medical Image Segmentation, and More,延续 SAM-Adapter 的成功,魔芯科技、科大等提出 SAM2-Adapter,让 SAM2 实现下游任务SOTA!

fc0ade86862c784f68200c7492607b3e.png
  • 项目页面:http://tianrun-chen.github.io/SAM-Adaptor

  • 论文链接:https://arxiv.org/abs/2408.04579

  • 开源代码:https://github.com/tianrun-chen/SAM-Adapter-PyTorch

“SAM-Adapter的成功经验同样适用于SAM2!”

在AI研究领域,基础模型的引入已经彻底改变了研究的格局,尤其是当这些模型基于庞大的数据集进行训练时。

近期,Segment Anything (SAM)模型因其在图像分割任务中的卓越表现而备受瞩目。尽管如此,先前的研究指出,SAM在处理一些具有挑战性的低级结构分割任务时存在性能瓶颈。

为了克服这些限制,研究者在SAM发布后不久便提出了SAM-Adapter,旨在通过增强SAM的功能,提升其在这些任务中的表现。SAM-Adapter 的架构如图所示。

dc2649b8eaf3805c6aeb8d31ce6faf1d.png

随着时间的推进,一个更为强大和通用的模型——Segment Anything 2 (SAM2)——应运而生。SAM2在网络架构上进行了优化,并在更广泛的视觉数据上进行了训练,引起了科研界的广泛关注。这引发了两个关键问题:

  • SAM在下游任务中遇到的挑战是否同样存在于SAM2?

  • 是否能够借鉴SAM-Adapter的成功经验,利用SAM2的先进预训练编码器和解码器,在这些任务中达到新的最前沿(SOTA)水平?

本研究的实验结果对这两个问题都给出了肯定的答案。尽管基础模型的固有局限性仍然存在,例如训练数据无法完全覆盖所有可能的场景,但通过引入SAM2-Adapter,研究者成功地在多个任务中实现了SOTA性能。

SAM2-Adapter不仅继承了SAM-Adapter的核心优势,还引入了显著的改进。以下是SAM2-Adapter的主要特点

  • 广泛的适用性:SAM2-Adapter能够适应各种任务,并在自定义数据集上实现优异的性能,几乎不需要额外的数据增强。

  • 高度的灵活性:SAM2-Adapter支持多种条件的集成,以微调SAM2,从而在特定任务上取得更好的结果。

SAM2-Adapter通过利用SAM2的多分辨率分层Transformer架构,进一步增强了这些优势。通过多个适配器的协同工作,SAM2-Adapter有效地利用了SAM2的多分辨率和分层特性,实现了更为精确和鲁棒的分割效果。网络结构图如下所示:

b3569e3ac387752855367c7335e7208a.png

“SAM2可以代替SAM在特定任务中实现SOTA表现”

本研究在多个任务和数据集上进行了广泛的实验,包括ISTD和COD10K数据集用于阴影检测,CHAMELEON和CAMO数据集用于伪目标检测,以及kvasir-SEG数据集用于医学图像分割任务。这些实验结果证明了SAM2和SAM2-Adapter在实现SOTA性能方面的潜力。

伪目标检测可视化结果如下

d66206c408e887faf379f199491b3c46.png 2d62f3d0483ffe4bbfa2f6699a8beaf6.png

阴影检测结果如下

fc3e7ba49eacdee449db4477720c364b.png 3554eec0ce1beca1396df9cb3936c08a.png

息肉分割实验结果如下

b5928137c254f56f15ff2b89aae57503.png 241a645f63a8c143869dbe47b791fdd2.png

总结与展望

SAM2-Adapter是一项突破性的创新技术,专为释放Segment Anything 2(SAM2)模型的全部潜力而设计,专注于攻克最具挑战性的分割任务。

延续了SAM-Adapter的成功经验,SAM2-Adapter再次突破了SAM2在伪装物体检测、阴影识别和息肉分割等复杂任务中的瓶颈,达到了行业顶尖的性能水准,树立了新的标杆。

从SAM到SAM2的持续挑战展示了将基础模型应用于多样化现实场景的复杂性。但令人鼓舞的是,SAM-Adapter和SAM2-Adapter出色地解决了这些问题,展现出它作为高精度分割工具的巨大潜力,适用于广泛的应用领域。

本文鼓励研究人员和工程师大胆采用SAM2与SAM2-Adapter的组合,以实现更卓越的分割性能,并推动图像分割领域向新的高峰迈进。

最新 AI 进展报道
请联系:amos@52cv.net

5026bf2ff9b8d5fb4428a9e9f88a2bfb.jpeg

END

欢迎加入「图像分割交流群👇备注:Seg

1f3ee63e87ef46c7f8b1402eff2f63e7.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值