SAM之后,视觉分割的路在何方?

文章探讨了计算机视觉中的分割任务,从SAM和Occ的发展谈起,指出分割提供精确边界的重要性,同时分析了其在自动驾驶中的挑战,如算力需求和后处理。作者认为尽管分割的应用广泛,但在某些场景下不如动静态目标感知重要,但随着算力提升,分割未来将得到更多关注。
摘要由CSDN通过智能技术生成

汽车人昨天分享了一篇OMG-Seg,这篇文章基本上把所有的分割任务都纳入到一个模型中。可以说分割已经迎来大一统。还记得去年SAM(分割万物Segment Anything)出来以后,最开始给汽车人的震撼很大,那会儿觉得计算机视觉即将迎来大变革和大一统的时代。几年前,汽车人也做过一些分割任务,像行车、泊车中的语义分割/全景分割、交通场景中的实例分割,也接触过一些交互式分割的内容。今天就借这个机会,和大家聊聊,SAM之后分割的路在何方?

首先先明确一个问题,我们为什么需要分割?或者说分割的必要性体现在哪里?相比于检测任务,分割提供了更精确的目标边界(像素级)。换句话说,所有需要使用目标精确边界的任务都离不开分割~像最常见的freespace(可行驶区域)以往都是使用分割任务实现,当然MapTR之后,也可以用多边形表示。

分割的劣势在哪里?很明显是算力和后处理,像检测输出的目标框可以天然的和下游任务结合。而分割则不行,下游是没办法直接使用逐像素的分割结果的,CPU负载太高且搜索空间太大,满足不了实时的要求。说实话这两年分割在车端自动驾驶中的较少。

Occ出来之后,分割似乎迎来新的春天,通用障碍物利用Occ输出。以往视觉分割通用障碍物的能力一般,且无法直接输出3D空间的信息,从这个角度来说,Occ有一定的不可替代性。

最后回归问题本身,分割的路在何方?汽车人个人的看法,分割有应用场景,但肯定不及动静态目标感知的地位。计算机视觉中的抠图、弹幕遮挡等等都能看到分割的应用。随着车载算力的不断增加,分割在未来几年或许会受到更多的重视,分割不应如此,也不会只如此。

以上内容均出自【自动驾驶之心知识星球】
d0adcb835b380b0625a4f72b2725a362.jpeg

自动驾驶之心知识星球,创办于2022年7月份,致力于打造为自动驾驶行业中的 ”黄埔军校“,目前近2400人,聚集了近50+自动驾驶行业专家为大家答疑解惑。

星球内已经打磨出近30+的学习路线,涉及BEV感知、动态/静态障碍物检测、多传感器融合、多传感器标定、目标跟踪、模型部署与cuda加速、仿真等方向,沉淀了大量工程上的解决方案、学术上的优化思路!星球主要内容一览:

5fe5b861974b096e655cce2ebcd2e78d.png

fd91757361357f8ee024ffe5052ebdd2.png

如何持续保持跟进和输入呢?我的答案是找对圈子,让你每天能够主动和被动接受很多新的知识,包括领域知识体系的梳理、刷题、面试经验、各家企业现状、各个岗位的具体职责以及后续的职业前景等。一个人入门学习,无异于大海捞针,浪费了大把时间踩坑,还得不到想要的答案。哪里有专业回答的规划呢?这里我推荐一个我们一直在维护的社区:自动驾驶之心知识星球,目前是国内最大、最专业的自动驾驶社区。欢迎加入!

efe0b58d8820c0741dddfc1f7403051d.jpeg

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值