bevfusion(multi task) 复现笔记

一点儿不通

已于 2024-03-12 14:53:47 修改

阅读量3k

点赞数 36

分类专栏：模型复现文章标签： linux 运维服务器

于 2024-01-08 20:53:25 首次发布

本文链接：https://blog.csdn.net/2301_76165329/article/details/135423442

版权

复现的笔记，有问题大家可以一起交流交流

paper：https://arxiv.org/abs/2205.13542

code：GitHub - mit-han-lab/bevfusion: [ICRA'23] BEVFusion: Multi-Task Multi-Sensor Fusion with Unified Bird's-Eye View Representation

1 基础环境配置

电脑配置：19-13900K，RTX4090

显卡驱动：525.116.04

环境： Ubuntu20.04

python=3.8.0

torch=1.10.0

cuda=11.3

cudnn=8.2

不同的模型存在包的版本冲突，最好使用虚拟环境

1.1 创建虚拟环境

# 自己的ubuntu先安装anacconda3或者miniconda

# 创建虚拟环境
conda create -n bevfusion_multi_task python=3.8.0

#进入虚拟环境
conda activate bevfusion_multi_task

1.2 安装各种依赖包

根据自己的机器的型号安装相应的cuda和torch包。Previous PyTorch Versions | PyTorchInstalling previous versions of PyTorchhttps://pytorch.org/get-started/previous-versions/复现使用的版本如下：

conda install pytorch==1.10.0 torchvision==0.11.0 torchaudio==0.10.0 cudatoolkit=11.3 -c pytorch -c conda-forge -y

安装相应依赖:

# 安装mpi4py时的依赖openmpi
sudo apt-get install wget libgl1-mesa-glx libglib2.0-0 openmpi-bin openmpi-common libopenmpi-dev libgtk2.0-dev git -y

执行上述代码,可跳过(安装OpenMPI).

安装OpenMPI，我主要参考

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

一点儿不通

关注关注

36
点赞
踩
60

收藏

觉得还不错? 一键收藏
2
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

【自动驾驶】《BEVFusion: Multi-Task Multi-Sensor Fusion with Unified Bird’s-Eye View Representation》论文阅读笔记

聿默的博客

09-18

2284

多传感器融合对于准确和可靠的自动驾驶系统至关重要。

ICCV 2019 PAMTRI: Pose-Aware Multi-Task Learning for Vehicle Re-Identification

11-20

1730

2 条评论您还未登录，请先登录后发表或查看评论

BEV感知---BevFusion详解

qq_44799766的博客

03-21

1万+

一种非常经典的多模态融合感知方案叫 BEVFusion。这是一种用于多任务多传感器 3D 感知的高效通用框架。BEVFusion 将相机和 LiDAR 功能统一在共享 BEV 空间中，完全保留几何和语义信息。相机和点云分支没有明显的主次关系，相互独立，结果上又相辅相成。高效、准确的多传感器感知对于自动驾驶汽车的安全至关重要。BEVFusion 将最先进的多传感器融合模型的计算成本降低了一半，并在小而远的物体以及雨天和夜间条件下实现了大幅精度提高。它为安全、稳健的自动驾驶铺平了道路。

BEVFusion复现

qq_44524636的博客

05-09

1820

bevfusion复现过程

文献总结：Bevfusion (mit)

热门推荐

h904798869的博客

08-10

2万+

BEV环境感知，多传感器融合，bevfusion代码部署

BEVFusion: Multi-Task Multi-Sensor Fusion with Unified Bird’s-Eye View Representation复现

qq_42719217的博客

08-04

1140

查看显卡：nvidia -smi查看CUDA版本 nvcc -v安装gpu版本的torch：pip install torch==1.10.0+cu113 torchvision==0.11.0+cu113 -f https://download.pytorch.org/whl/torch_stable.html。

BEVFusion-复现问题:CUDA error: no kernel image is available for execution on the device

ll594282475的博客

06-20

1596

BEVFusion RuntimeError: CUDA error: no kernel image is available for execution on the device CUDA kernel errors might be asynchronously reported at some other API call,so the stacktrace below might be incorrect. For debugging consider passing CUDA_LAUNCH_B

ICCV2017《Deep Direct Regression for Multi-Oriented Scene Text Detection》阅读笔记

ryERO的博客

10-20

695

前言本文是对《Deep Direct Regression for Multi-Oriented Scene Text Detection》论文的简要介绍和细节分析，由于作者没有放出源码，所以本文没有源码解读的部分，有关的复现工作将在下篇博客介绍。注：编者水平有限，如有谬误，欢迎指正。若要转载，请注明出处，谢谢。联系方式：邮箱：yue_zhan@yahoo.com QQ：115635662...

中文文本纠错_论文Spelling Error Correction with Soft-Masked BERT(ACL_2020)学习笔记与模型复现

qq_35128926的博客

07-01

7062

中文文本纠错_论文Spelling Error Correction with Soft-Masked BERT(ACL_2020)学习笔记与模型复现最近在ACL 2020上看到一篇论文《Spelling Error Correction with Soft-Masked BERT》,论文的主题为中文文本纠错中的**Chinese spelling error correction (CSC)**任务，论文作者为来自字节跳动AI Lab与复旦大学的研究人员。《Spelling Error Correct

bevfusion结果可视化拼接展示

04-28

将bevfusion的可视化结果，一共八个文件夹，其中六个为环视相机标注后的图片，一个是激光雷达的图片，一个是地图，按照想要的视角顺序拼接图片并合成视频

BEVFusion（mit）复现Ubuntu20.04终端配置

qq_60423839的博客

12-12

3729

参考文章大致上参考这篇文章，但还是遇到了很多问题首先查看cuda版本，原文要求11.3，这里使用的是11.1也没有问题nvcc -V因为服务器上有多个版本的cuda，参考此处切换创建switch-cuda.sh文件之后可以按以下指令切换创建虚拟环境并安装torch因为本人使用的是cuda11.1，所以将cu113改为cu111安装下列，记得先配置好镜像源再安装，不然会很慢。配置镜像源参考的这篇。

复现BEVFusion遇到过的问题

weixin_62497890的博客

09-21

2965

关于bevfusion的报错问题，很多GitHub的issue里都有，我记录在此也是方便自己查看，省的以后重新来还要一个问题一个问题去翻找

BEVFusion(mit)最强环境安装，部署复现

qq_45783225的博客

06-21

1万+

BEVFusion作为一项经典的工作，值得深入探索。然而由于配置环境比较麻烦，耽误了一些时间。经过几次成功配置之后，有了一些总结，在这里记录下来，供大家参考避坑，也方便自己下次查阅。

BEVFusion（mit）

qq_45783225的博客

05-23

820

对于关键词传感器融合&BEV，如果放在一起那确实是挺窄的方向，但凡去掉一个关键词，都是一个热门的大方向。所以今天就犯了一个错误，总觉得怕自己学的不够全面，又想看BEV融合，但同时又不想错过各个领域的好方法，于是还emo了一会。首先利用swin-t提取相机的特征，然后利用lss把图像空间的特征转变为BEV空间下的特征，具体做法是先利用估计得到图像的深度，再根据深度得到投射到空间中的伪点云特征。为了避免特征在转变为BEV时产生的误差导致的融合不准确，利用带有残差的卷积BEV编码器来融合特征，补偿失调。

多模态融合 - BEVFusion: Multi-Task Multi-Sensor Fusion with Unified Bird‘s-Eye View Repre ... (ICRA 2023)

77wpa的博客

06-19

2758

多传感器融合对于准确可靠的自动驾驶系统至关重要。最近的方法是基于点级融合：用相机特征增强激光雷达点云。然而，相机到激光雷达的投影丢弃了相机特征的语义密度，阻碍了这种方法的有效性，尤其是对于面向语义的任务（如3D场景分割）。在本文中，我们用BEVFusion打破了这一根深蒂固的惯例，BEVFusions是一种高效通用的多任务多传感器融合框架。它在共享鸟瞰图（BEV）表示空间中统一了多模态特征，很好地保留了几何和语义信息。

【CUDA-BEVFusion】可视化源文件src/common/visualize.cu （二）

old_power的博客

01-17

614

核心作用是**将3D感知数据（点云和边界框）投影到2D图像平面，并生成直观的可视化结果**，帮助开发者或用户理解感知算法的输出

BevFusion (2): nuScenes 数据介绍及点云可视化

@bangbang的博客

02-27

2891

nuScenes 数据集 (pronounced /nu:ːsiː:nz/) 是由 Motional (以前称为 nuTonomy) 团队开发的自动驾驶公共大型数据集。nuScenes 数据集的灵感来自于开创性的 KITTI 数据集。nuScenes 是第一个提供自动驾驶车辆整个传感器套件(6 个摄像头、1 个 LIDAR、5 个 RADAR、GPS、IMU) 数据的大型数据集。与 KITTI 相比，nuScenes 包含的对象注释多了 7 倍。

multi task learning

03-16

多任务学习（Multi-Task Learning）是指在一个模型中同时学习多个相关任务的技术。这些任务可以是不同的，但是它们之间存在一定的联系或者共同点。通过多任务学习，可以提高模型的泛化能力和效率，同时减少模型的...