面向工程,高精度高效率!FastBEV-笔记

摘要

现有大多数的BEV解决方案要么需要大量资源来执行车载推理,要么性能不佳

Fast BEV是一种简单而有效的框架,它能够在车载芯片上执行更快的BEV感知。

 为了实现这一目标,作者首先从经验上发现,BEV表示可以足够强大,而无需昂贵的基于transformer的变换或深度表示。

FastBEV由以下五部分组成:

  • (1)Fast-Ray变换

一种轻量级的、易于部署的视图转换,它将2D图像特征快速传输到3D体素空间;

本文提出了Fast Ray变换,这是一种用于快速推理的轻量级和部署友好的视图变换,通过将多视图2D图像特征沿着相机射线的体素投影到3D来获得BEV表示。

  • (2)多尺度图像编码器

一种利用多尺度信息获得更好性能的多尺度图像编码器;

  • (3)高效BEV编码器

一种高效的BEV编码器,它专门设计用于加快车载推理;

  • (4)数据增强

针对图像和BEV空间的强大数据增强策略以避免过度拟合,

  • (5)时间融合

利用时间信息的多帧特征融合机制。

这些都使Fast BEV成为一种具有高性能、快速推理速度和在自动驾驶车载芯片上部署友好的解决方案

领域现状

基于纯相机的鸟瞰图(BEV)方法最近显示出其强大的3D感知能力和低成本的巨大潜力。

基本上遵循这样的范式:将多摄像机2D图像特征转换为自我汽车坐标中的3D BEV特征,然后将特定头部应用于统一BEV表示以执行特定的3D任务,例如,3D检测、分割等。 

为了从2D图像特征执行3D感知,nuScenes上的现有BEV方法使用基于查询的transformation [17](由于解码器需要transfromer内的注意机制,这些方法通常需要专用芯片来支持),[18]或基于隐式/显式深度的transformation [13],[15],[26]。然而,它们很难部署在车载芯片上,并且推理速度慢:

参考链接:

https://mp.weixin.qq.com/s?__biz=Mzg2NzUxNTU1OA==&mid=2247526751&idx=1&sn=87b8f67fd05c38b31d6c266a89b86307&chksm=ceb84496f9cfcd8024b0b472433c700369e7e74bfe1eb430aa94e88a22605d9d92da29a0bd6b&mpshare=1&scene=23&srcid=0215OcWYQjsxCRH56d929GtM&sharer_sharetime=1676422164857&sharer_shareid=67ac7577b649f09043877767d294e51c#rd

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值