FastSAM: 快速分割所有物体

点击下方卡片,关注“小白玩转Python”公众号

FastSAM,基于YOLOv8的检测分支和基于YOLACT的分割分支98df456f2c78aef885ecd6dca26ca6e1.png

  • SAM的庞大计算成本阻碍了它在工业场景中的更广泛应用。

  • 在本文中,提出了FastSAM,将任务重新定义为分割生成和提示,发现一个带有实例分割分支的标准CNN检测器也能很好地完成这项任务。

大纲

1. FastSAM

2. Results

1. FastSAM

1a4949ee93a2390ee5d260c7df72d779.png

1.1. 全实例分割阶段

  • 使用YOLOv8检测主干,并应用YOLACT原理进行实例分割,即YOLOv8-seg。

  • 它从通过主干网络和特征金字塔网络(FPN)提取图像特征开始。

  • 检测分支输出类别和边界框,而分割分支输出k个原型(FastSAM默认为32)以及k个掩模系数。

  • 分割和检测任务并行计算。

  • 分割分支输入高分辨率特征图。这张图通过卷积层处理,放大,然后通过另外两个卷积层输出掩模。

  • 掩模系数类似于检测头的分类分支,范围在-1到1之间。实例分割结果是通过将掩模系数与原型相乘然后求和得到的。

1.2. 提示引导选择阶段

  • 点提示:与SAM类似,前景/背景点可以作为提示。

  • 框提示:目标是识别与选定框IoU分数最高的掩模,从而选择感兴趣的对象。

  • 文本提示:如上所示,使用CLIP模型提取文本的相应文本嵌入。然后确定相应的图像嵌入,并使用相似性度量将它们与每个掩模的内在特征匹配。然后选择与文本提示的图像嵌入相似性分数最高的掩模。

1.3. 数据

  • 仅使用SAM使用的SA-1B数据集的1/50来训练FastSAM模型。

2. 结果

2.1. 运行时间

1e71d684c3d9549c302baee1a9a8d94b.png

0875aa5c3de181a366a513278124c0a5.png

尽管FastSAM生成了相对令人满意的结果,如图3所示,FastSAM在所有提示数量上的速度都超过了SAM。此外,FastSAM的运行速度不会随着提示而改变。

2.2. 零样本边缘检测

bcc5d31c9abdb5d990393a25ef3e2a5c.png

FastSAM的参数数量显著减少(仅68M),它生成了一个普遍良好的边缘图。

75751f664da914a0a6f5cffa55818d02.png

FastSAM与SAM的性能相似,特别是R50更高,AP更低。

2.3. 零样本对象提议生成

23a8afb480c0848c3e6ac4b2b0d7248b.png

2abe352de8a0fa6189582caff8854d60.png

  • 虽然其他人是监督方法,但FastSAM和SAM实现了完全零样本转移。

  • FastSAM和SAM在AR@10精度上表现不佳。然而,在AR@1000上,FastSAM明显优于OLN [17]。

5a6a14502779dff23d28a0f9fe830456.pngFastSAM大大超过了SAM最计算密集的模型SAM-H E64,超过5%。

然而,与在LVIS数据集上训练的ViTDet-H相比,它还是有所不足。

9b9a86c5543c6297fd3a7e9e176ca070.png

同样,FastSAM的掩模提议生成在召回率上相对较低。

2.4. 零样本实例分割

7cfee0bcacf2fbf9f7c66e60275c3971.png

在这项任务上,FastSAM未能实现高AP。

3194ad42e42e0d7bd6687f57e6a66eff.png

但定性地说,FastSAM仍然可以基于文本提示很好地分割对象。

2.5. 真实世界应用

56575912656576ac35b13ced2e7b6812.png

248fdf2d3492b1a464e7c781362ee409.png

  • 图7:通过前景/背景点(FastSAM-point中的黄色和品红色点)或框引导选择,FastSAM可以在确切的缺陷区域进行分割。

  • 图8:在一切模式下,FastSAM与SAM仅有微小差异,因为它分割了更少与任务无关的背景对象。

503c8c8332f29f5c149cc7c101ffe127.png

fda7d24b0d97aac44fb306ccd8e63619.png

  • 图9:FastSAM在分割规则形状的对象方面表现良好,但与SAM相比,它分割了更少与阴影相关的区域。

  • 图10:在一些图像上,FastSAM甚至为大型对象生成了更好的掩模。

2.6. 失败模式

7e6a8c88d9c96a3fecec246c0bf96724.png

  • 低质量的小尺寸分割掩模具有较大的置信度分数。

  • 一些微小尺寸对象的掩模倾向于接近正方形。

·  END  ·

🌟 想要变身计算机视觉小能手?快来「小白玩转Python」公众号!

回复Python视觉实战项目,解锁31个超有趣的视觉项目大礼包!🎁

fa8c2d6c4a2bff5584f7e54ec6d0b7e7.png

本文仅供学习交流使用,如有侵权请联系作者删除

  • 12
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
4S店客户管理小程序-毕业设计,基于微信小程序+SSM+MySql开发,源码+数据库+论文答辩+毕业论文+视频演示 社会的发展和科学技术的进步,互联网技术越来越受欢迎。手机也逐渐受到广大人民群众的喜爱,也逐渐进入了每个用户的使用。手机具有便利性,速度快,效率高,成本低等优点。 因此,构建符合自己要求的操作系统是非常有意义的。 本文从管理员、用户的功能要求出发,4S店客户管理系统中的功能模块主要是实现管理员服务端;首页、个人中心、用户管理、门店管理、车展管理、汽车品牌管理、新闻头条管理、预约试驾管理、我的收藏管理、系统管理,用户客户端:首页、车展、新闻头条、我的。门店客户端:首页、车展、新闻头条、我的经过认真细致的研究,精心准备和规划,最后测试成功,系统可以正常使用。分析功能调整与4S店客户管理系统实现的实际需求相结合,讨论了微信开发者技术与后台结合java语言和MySQL数据库开发4S店客户管理系统的使用。 关键字:4S店客户管理系统小程序 微信开发者 Java技术 MySQL数据库 软件的功能: 1、开发实现4S店客户管理系统的整个系统程序; 2、管理员服务端;首页、个人中心、用户管理、门店管理、车展管理、汽车品牌管理、新闻头条管理、预约试驾管理、我的收藏管理、系统管理等。 3、用户客户端:首页、车展、新闻头条、我的 4、门店客户端:首页、车展、新闻头条、我的等相应操作; 5、基础数据管理:实现系统基本信息的添加、修改及删除等操作,并且根据需求进行交流信息的查看及回复相应操作。
现代经济快节奏发展以及不断完善升级的信息化技术,让传统数据信息的管理升级为软件存储,归纳,集中处理数据信息的管理方式。本微信小程序医院挂号预约系统就是在这样的大环境下诞生,其可以帮助管理者在短时间内处理完毕庞大的数据信息,使用这种软件工具可以帮助管理人员提高事务处理效率,达到事半功倍的效果。此微信小程序医院挂号预约系统利用当下成熟完善的SSM框架,使用跨平台的可开发大型商业网站的Java语言,以及最受欢迎的RDBMS应用软件之一的MySQL数据库进行程序开发。微信小程序医院挂号预约系统有管理员,用户两个角色。管理员功能有个人中心,用户管理,医生信息管理,医院信息管理,科室信息管理,预约信息管理,预约取消管理,留言板,系统管理。微信小程序用户可以注册登录,查看医院信息,查看医生信息,查看公告资讯,在科室信息里面进行预约,也可以取消预约。微信小程序医院挂号预约系统的开发根据操作人员需要设计的界面简洁美观,在功能模块布局上跟同类型网站保持一致,程序在实现基本要求功能时,也为数据信息面临的安全问题提供了一些实用的解决方案。可以说该程序在帮助管理者高效率地处理工作事务的同时,也实现了数据信息的整体化,规范化与自动化。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值