关注公众号,发现CV技术之美
本篇分享论文SAM2-Adapter: Evaluating & Adapting Segment Anything 2 in Downstream Tasks: Camouflage, Shadow, Medical Image Segmentation, and More
,延续 SAM-Adapter 的成功,魔芯科技、科大等提出 SAM2-Adapter,让 SAM2 实现下游任务SOTA!
![fc0ade86862c784f68200c7492607b3e.png](https://img-blog.csdnimg.cn/img_convert/fc0ade86862c784f68200c7492607b3e.png)
项目页面:http://tianrun-chen.github.io/SAM-Adaptor
论文链接:https://arxiv.org/abs/2408.04579
开源代码:https://github.com/tianrun-chen/SAM-Adapter-PyTorch
“SAM-Adapter的成功经验同样适用于SAM2!”
在AI研究领域,基础模型的引入已经彻底改变了研究的格局,尤其是当这些模型基于庞大的数据集进行训练时。
近期,Segment Anything (SAM)模型因其在图像分割任务中的卓越表现而备受瞩目。尽管如此,先前的研究指出,SAM在处理一些具有挑战性的低级结构分割任务时存在性能瓶颈。
为了克服这些限制,研究者在SAM发布后不久便提出了SAM-Adapter,旨在通过增强SAM的功能,提升其在这些任务中的表现。SAM-Adapter 的架构如图所示。
![dc2649b8eaf3805c6aeb8d31ce6faf1d.png](https://img-blog.csdnimg.cn/img_convert/dc2649b8eaf3805c6aeb8d31ce6faf1d.png)
随着时间的推进,一个更为强大和通用的模型——Segment Anything 2 (SAM2)——应运而生。SAM2在网络架构上进行了优化,并在更广泛的视觉数据上进行了训练,引起了科研界的广泛关注。这引发了两个关键问题:
SAM在下游任务中遇到的挑战是否同样存在于SAM2?
是否能够借鉴SAM-Adapter的成功经验,利用SAM2的先进预训练编码器和解码器,在这些任务中达到新的最前沿(SOTA)水平?
本研究的实验结果对这两个问题都给出了肯定的答案。尽管基础模型的固有局限性仍然存在,例如训练数据无法完全覆盖所有可能的场景,但通过引入SAM2-Adapter,研究者成功地在多个任务中实现了SOTA性能。
SAM2-Adapter不仅继承了SAM-Adapter的核心优势,还引入了显著的改进。以下是SAM2-Adapter的主要特点:
广泛的适用性:SAM2-Adapter能够适应各种任务,并在自定义数据集上实现优异的性能,几乎不需要额外的数据增强。
高度的灵活性:SAM2-Adapter支持多种条件的集成,以微调SAM2,从而在特定任务上取得更好的结果。
SAM2-Adapter通过利用SAM2的多分辨率分层Transformer架构,进一步增强了这些优势。通过多个适配器的协同工作,SAM2-Adapter有效地利用了SAM2的多分辨率和分层特性,实现了更为精确和鲁棒的分割效果。网络结构图如下所示:
![b3569e3ac387752855367c7335e7208a.png](https://img-blog.csdnimg.cn/img_convert/b3569e3ac387752855367c7335e7208a.png)
“SAM2可以代替SAM在特定任务中实现SOTA表现”
本研究在多个任务和数据集上进行了广泛的实验,包括ISTD和COD10K数据集用于阴影检测,CHAMELEON和CAMO数据集用于伪目标检测,以及kvasir-SEG数据集用于医学图像分割任务。这些实验结果证明了SAM2和SAM2-Adapter在实现SOTA性能方面的潜力。
伪目标检测可视化结果如下
![d66206c408e887faf379f199491b3c46.png](https://img-blog.csdnimg.cn/img_convert/d66206c408e887faf379f199491b3c46.png)
![2d62f3d0483ffe4bbfa2f6699a8beaf6.png](https://img-blog.csdnimg.cn/img_convert/2d62f3d0483ffe4bbfa2f6699a8beaf6.png)
阴影检测结果如下
![fc3e7ba49eacdee449db4477720c364b.png](https://img-blog.csdnimg.cn/img_convert/fc3e7ba49eacdee449db4477720c364b.png)
![3554eec0ce1beca1396df9cb3936c08a.png](https://img-blog.csdnimg.cn/img_convert/3554eec0ce1beca1396df9cb3936c08a.png)
息肉分割实验结果如下
![b5928137c254f56f15ff2b89aae57503.png](https://img-blog.csdnimg.cn/img_convert/b5928137c254f56f15ff2b89aae57503.png)
![241a645f63a8c143869dbe47b791fdd2.png](https://img-blog.csdnimg.cn/img_convert/241a645f63a8c143869dbe47b791fdd2.png)
总结与展望
SAM2-Adapter是一项突破性的创新技术,专为释放Segment Anything 2(SAM2)模型的全部潜力而设计,专注于攻克最具挑战性的分割任务。
延续了SAM-Adapter的成功经验,SAM2-Adapter再次突破了SAM2在伪装物体检测、阴影识别和息肉分割等复杂任务中的瓶颈,达到了行业顶尖的性能水准,树立了新的标杆。
从SAM到SAM2的持续挑战展示了将基础模型应用于多样化现实场景的复杂性。但令人鼓舞的是,SAM-Adapter和SAM2-Adapter出色地解决了这些问题,展现出它作为高精度分割工具的巨大潜力,适用于广泛的应用领域。
本文鼓励研究人员和工程师大胆采用SAM2与SAM2-Adapter的组合,以实现更卓越的分割性能,并推动图像分割领域向新的高峰迈进。
最新 AI 进展报道
请联系:amos@52cv.net
END
欢迎加入「图像分割」交流群👇备注:Seg