分割大模型论文阅读——SAM on Medical Images: A Comprehensive Study on Three Prompt Modes

最新推荐文章于 2024-07-25 23:03:48 发布

Philo`

最新推荐文章于 2024-07-25 23:03:48 发布

阅读量24

点赞数

分类专栏： SAM大模型论文阅读文章标签：论文阅读深度学习人工智能图像处理 pytorch 计算机视觉机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44864833/article/details/139038989

版权

SAM大模型论文阅读专栏收录该内容

9 篇文章 5 订阅 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

ATTransUNet

期刊分析
可借鉴参考

期刊分析

期刊名： arXiv
期刊信息： 2023-4-28
在这里插入图片描述

摘要

分割任意模型（SAM）最近引人注目，激发了许多研究人员探索其在零样本泛化能力方面的潜力和局限性。作为第一个用于分割任务的快速基础模型，它是在具有空前数量的图像和注释的大型数据集上进行训练的。这种大规模数据集及其及时性赋予模型强大的零样本泛化能力。尽管 SAM 在多个数据集上表现出了有竞争力的性能，但我们仍然想研究其在医学图像上的零样本泛化。众所周知，医学图像标注的获取通常需要专业从业者的大量努力。因此，如果存在一个基础模型，可以仅根据几个点提示就给出高质量的掩模预测，那么该模型无疑将成为医学图像分析的游戏规则改变者。为了评估 SAM 是否有潜力成为医学图像分割任务的基础模型，我们收集了超过 12 个涵盖各种器官和模式的公共医学图像数据集。我们还探讨了什么样的提示可以通过不同的方式带来最佳的零样本性能。此外，我们发现一种模式表明框大小的扰动将显着改变预测精度。最后，大量实验表明，不同数据集的预测掩模质量差异很大。向 SAM 提供适当的提示（例如边界框）将显着提高其性能。

引言

近年来，用数十亿甚至数万亿参数预训练的大型语言模型已成为人工智能领域最有影响力的趋势。 ChatGPT 或 LLaMA 等大型语言模型 (LLM) 可以轻松扩展

了解本专栏

超级会员免费看

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
分割大模型论文阅读——SAM on Medical Images: A Comprehensive Study on Three Prompt Modes

分割任意模型（SAM）最近引人注目，激发了许多研究人员探索其在零样本泛化能力方面的潜力和局限性。作为第一个用于分割任务的快速基础模型，它是在具有空前数量的图像和注释的大型数据集上进行训练的。这种大规模数据集及其及时性赋予模型强大的零样本泛化能力。尽管 SAM 在多个数据集上表现出了有竞争力的性能，但我们仍然想研究其在医学图像上的零样本泛化。众所周知，医学图像标注的获取通常需要专业从业者的大量努力。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Philo` 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。