多相机BEV感知表达

Pancy93

已于 2023-02-07 21:44:30 修改

阅读量377

点赞数

分类专栏：多相机BEV感知表达文章标签： linux 运维服务器

于 2022-12-01 21:35:42 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/panxiying1993/article/details/128138010

版权

参考 https://mp.weixin.qq.com/s/CDLSSzlznPKMnxeo9VqmZA

基于纯视觉/图像信息 相机传感器可以很好的捕捉图像中物体包含的丰富的色彩和纹理信息；但由于图像成像过程中的限制，得到的2D图像无法保留物体在深度方向的信息；

基于纯激光雷达信息 激光雷达传感器可以提供物体准确的深度信息以及结构信息；但激光雷达传感器提供物体信息的距离比较有限，同时其获得的点云数据与相机传感器采集到的图像信息相比更加稀疏；

基于多种传感器信息融合 毫米波雷达传感器采集到的数据相比于激光雷达传感器获取的数据更加稀疏；但其获取的物体信息范围相较于激光雷达传感器更远，同时可以更好的采集运动物体的信息；

基于BEV空间实现感知任务的优势：在各类算法模型得到BEV空间特征后，可以基于获得的BEV特征实现3D目标检测、车道线检测、地图语义分割等不同的感知任务，而且不同任务的感知结果可以很自然的应用到自动驾驶的后续模块（如：规划和控制）；

在BEV空间下，可以非常方便的将不同视角、不同时间序列（帧）、不同模态（传感器）的特征信息进行融合，输出更加准确的BEV空间特征，从而更好地实现自动驾驶感知任务；相较于基于其他视角的纯视觉感知方法，基于BEV空间的感知算法以俯视的角度去实现感知任务，可以比较好的缓解不同物体间的遮挡问题；

1. BEVFormer

1) 按照BEVFormer github的指导先后安装和编译 mmdetection3d-0.17.1和BEVFormer

conda create -n BEVFormer python=3.8

2)下载数据集nuScenes

数据集full nuScenes v1.0：包含1000个场景。由于数据集的巨大规模，分别提供了mini、训练验证集。Mini（10个场景）是用于探索数据而无需下载整个数据集的trainval的子集。Trainval（70

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。