纽约大学和博世最新AdaOcc：自适应分辨率占用预测

最新推荐文章于 2024-09-17 14:20:51 发布

自动驾驶之心

最新推荐文章于 2024-09-17 14:20:51 发布

阅读量211

点赞数

原文链接：https://mp.weixin.qq.com/s?__biz=Mzg2NzUxNTU1OA==&mid=2247626484&idx=4&sn=a4674a8b4216d5d0ff71c7981f40dda7&chksm=cf60a663013ac131d4e44735ea30e630783fec927f4bbcf00b55b48f5291934e785456037201&scene=126&sessionid=0

版权

作者 | 自动驾驶专栏编辑 | 自动驾驶专栏

点击下方卡片，关注“自动驾驶之心”公众号

戳我-> 领取自动驾驶近15个方向学习路线

>>点击进入→自动驾驶之心『占用网络』技术交流群

本文只做学术分享，如有侵权，联系删文

论文链接：https://arxiv.org/pdf/2408.13454
代码链接：https://github.com/ai4ce/Bosch-NYU-OccupancyNet/

摘要

本文介绍了AdaOcc：自适应分辨率占用预测。在复杂的城市场景中实现自动驾驶需要3D感知既全面又精确。传统的3D感知方法着重于目标检测，导致缺乏环境细节信息的稀疏表示。最近的方法估计车辆周围的3D占用，以获得更全面的场景表示。然而，稠密的3D占用预测提高了计算需求，给效率和分辨率之间的平衡带来挑战。高分辨率占用栅格提供了准确性，但是需要大量的计算资源，而低分辨率栅格效率高，但是缺乏细节信息。为了解决这一难题，本文引入了AdaOcc，这是一种新的自适应分辨率、多模态的预测方法。本文方法将以目标为中心的3D重建和整体占用预测集成到一个框架内，仅在感兴趣区域（ROIs）内进行高度精细且精确的3D重建。这些高度精细的3D表面以点云表示，因此其精度不受占用地图的预定义栅格分辨率所限制。本文在nuScenes数据集上进行全面实验，证明了相比于现有方法具有显著改进。在近距离场景中，本文方法在IOU上超过先前的基线13%，在Hausdorff距离上超过了40%。总之，AdaOcc提供了更通用、更有效的框架，能够在各种驾驶场景中提供准确的3D语义占用预测。

主要贡献

本文的贡献总结如下：

1）本文提出了一种多模态自适应分辨率方法，在关键区域中提供了三种高精度的输出表示，同时维持实时应用的效率；

2）本文开发了一种有效的联合训练范式，可以增强占用预测和目标折叠分支之间的协同作用；

3）本文方法在nuScenes数据集上展现出卓越的精度，特别是在需要精确行为的近距离场景中表现出色。

论文图片和表格

总结

总之，本文所提出的方法提供了一种多模态自适应分辨率方法，在关键区域中提供了三种具有高精度表面的输出表示，同时确保了实时应用的效率。此外，本文还开发了一种有效的联合训练范式，以增强占用和折叠网络之间的协同作用，从而提高近距离占用预测的性能。本文方法在nuScenes数据集上展现出卓越的精度，突出了对精细表面重建的注重。

局限性：本文发现，联合训练方法没有显著提高目标检测任务的质量。需要进一步研究粗略占用预测和目标表面重建之间的相互作用，以提高不同表示之间的一致性。此外，通过更高级的并行化设计，能够进一步优化统一框架的效率。

投稿作者为『自动驾驶之心知识星球』特邀嘉宾，欢迎加入交流！重磅，自动驾驶之心科研论文辅导来啦，申博、CCF系列、SCI、EI、毕业论文、比赛辅导等多个方向，欢迎联系我们！

① 全网独家视频课程

BEV感知、BEV模型部署、BEV目标跟踪、毫米波雷达视觉融合、多传感器标定、多传感器融合、多模态3D目标检测、车道线检测、轨迹预测、在线高精地图、世界模型、点云3D目标检测、目标跟踪、Occupancy、cuda与TensorRT模型部署、大模型与自动驾驶、Nerf、语义分割、自动驾驶仿真、传感器部署、决策规划、轨迹预测等多个方向学习视频（扫码即可学习）

网页端官网：www.zdjszx.com

② 国内首个自动驾驶学习社区

国内最大最专业，近3000人的交流社区，已得到大多数自动驾驶公司的认可！涉及30+自动驾驶技术栈学习路线，从0到一带你入门自动驾驶感知（2D/3D检测、语义分割、车道线、BEV感知、Occupancy、多传感器融合、多传感器标定、目标跟踪）、自动驾驶定位建图（SLAM、高精地图、局部在线地图）、自动驾驶规划控制/轨迹预测等领域技术方案、大模型、端到端等，更有行业动态和岗位发布！欢迎扫描下方二维码，加入自动驾驶之心知识星球，这是一个真正有干货的地方，与领域大佬交流入门、学习、工作、跳槽上的各类难题，日常分享论文+代码+视频