BEVDET

jiangyongyu

已于 2022-10-18 16:49:21 修改

阅读量1.7k

点赞数

文章标签：计算机视觉人工智能算法

于 2022-10-09 09:52:28 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/FfarFat/article/details/127221048

版权

思想

相机视图进行特征提取和深度估计，根据深度估计的信息和特征进行融合，得到三维空间的特征
生成pillar
1. 生成图像空间内的三维坐标，根据特征下采样的倍数及深度数来生成
2. 上述三维坐标变换到点云空间，有以下几步变换
  1. 图像是有数据增强的，如旋转、平移、缩放等，浓缩成两个变换，仿射和平移，那第一步是增强后的三维坐标还原为原始的三维坐标，即平移和仿射的逆变换
  2. 图像坐标系到相机坐标系，即乘以内参矩阵
  3. 相机坐标系到点云坐标系，刚体变换，旋转+平移
3. 生成融合特征，即点云空间的三维坐标及图像特征融合
  1. 点云空间的三维坐标pillar化，减去点云的起点，除以点云的步长
  2. 筛选，保留点云设定范围内的点
  3. voxel内的点筛选留存，留存最大数为300，即相同voxel内点保留前300个，排序按照batch D H W依次来排
  4. 设定pillar特征尺寸， B C D H W 300，按照排序后的坐标将x的值赋值到上面
  5. 最后一个维度sum，第三个维度和第二个维度flatten，得到Pillar特征
再接neck，以及使用类似centerpoint的head

模型结构

输入

以nuscenes为例，输入是6个camera的数据，尺寸为1 * 6 * 3 * 256 * 704

前处理

test

只做两个变换，缩放和平移

网络部分

part1 生成伪点云

基于6个cameras的输入，输出612316*44
前59维为深度信息，单独提出，然后与后64维度相乘
如下图，生成深度图

part2 bev pool

根据点云范围得到点云的网格，生成伪点云

part3 bev detector

对生成的bev走centerpoint的推理流程

onnx模型导出

由于网络中存在bev pool，直接导出模型不方便，将网络切成两个部分，bevdet_pseudo_cloud和bevdet_detector，需要重写forward函数，修改代码不是很好，我们参考mmdeploy的方案，运行时对bevdet注册一些函数，用来导出两个部分的onnx，git地址

模型推理 onnxruntime or tensorrt

自定义int8量化

参考博客

参考论文

https://github.com/nv-tlabs/lift-splat-shoot

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
2
评论
BEVDET

bevdet论文源码学习及onnx模型导出
复制链接

扫一扫

jiangyongyu CSDN认证博客专家 CSDN认证企业博客

码龄7年

6: 原创

81万+: 周排名

195万+: 总排名

7874: 访问

: 等级

69: 积分

2: 粉丝

5: 获赞

4: 评论

15: 收藏

私信

关注

热门文章

分类专栏

ocr 2篇
onnx 2篇

最新评论

BEVDET
jiangyongyu: 是的，中间部分看你用什么计算平台，如果是nvidia的话，就用git的cuda加速代码，其它平台就需要自己去写加速了
BEVDET
yang_njupt: 你好，请教下，模型导出为两个onnx，那中间部分的bev pool还是用git里面代码吗，请问有推理的demo吗
车牌识别难点克服，c++部署
AI吃大瓜: 推荐这个智能驾驶《C++实现车牌检测和识别（可实时车牌识别）》https://blog.csdn.net/guyuealian/article/details/128704276
onnx-modifier详解（好用的onnx模型修改工具）
sweet&spicy: 写的太好啦~赞👍

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。