硬件加速 3D 实时感知 (HARP-3D)

最新推荐文章于 2022-09-22 01:26:37 发布

Hack电子

最新推荐文章于 2022-09-22 01:26:37 发布

阅读量328

点赞数

文章标签：算法 python 机器学习人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/HackEle/article/details/124054320

版权

硬件加速 3D 实时感知 (HARP-3D)

使用在 ULTRA96V2 上运行的深度神经网络在 LiDAR 点云中进行 3D 对象检测的端到端演示。

本项目用到的东西

Ultra96-V2

绪论

理念

感知是自动驾驶中的一项关键任务，并且可能是当今技术界讨论最多的话题之一。

简单来说，感知是理解数据的任务。这些数据通常由各种传感器生成，例如相机、雷达、激光雷达等。

最常用的感知任务是对象检测和语义分割。

对象检测是在传感器数据中定位和分类感兴趣的对象的任务。

语义分割是将传感器数据的每个像素/元素标记为属于一组感兴趣类别中的一个类别的任务。

深度神经网络 (DNN) 已经发展成为复杂感知算法的支柱，否则使用传统的计算机视觉算法几乎不可能进行设计。

任何类型的 DNN 的基本数学运算都是矩阵乘法。

事实证明，矩阵乘法是一种可以高度并行化的运算。这就是 GPU 对深度学习有用的根本原因。

这就是硬件加速可以作为加速深度学习算法的一种手段。

本项目旨在演示这一点，使用 Ultra96v2 开发板作为硬件加速平台。

Ultra96v2 基于 Xilinx Zynq MPSoC 平台，开发板具有除 FPGA 之外的其他几个外设。

该项目演示了如何使用 Ultra96v2 作为硬件加速平台和 Vitis-AI 作为软件平台在 LiDAR 点云中执行对象检测。它还以端到端的方式演示了带有对象检测模型的 Ultra96v2 如何作为边缘 AI 应用程序工作。

传感器数据

该项目使用 LiDAR 传感器数据作为输入。现在，由于传感器的状态非常昂贵，该项目使用来自最先进的 LiDAR 传感器的预先记录的数据。这是KITTI数据集（http://www.cvlibs.net/datasets/kitti/）。

传感器的典型扫描，称为点云如下所示。

点云中的每个点都由至少 3 个数字表示，这些数字对应于 3D 空间中该点相对于传感器的 x、y 和 z 坐标。

目标

我们试图确定汽车和其他物体在上述点云中的位置，并在它们周围放置一个边界框。

这如下所示。

神经网络

使用的神经网络是称为U-Net的语义分割网络。

❝
https://arxiv.org/abs/1505.04597

它被修改为预测关键点，其中关键点是范围图像中的对象中心。

一旦我们有了关键点，一个简单的后处理步骤将它们转换回 3D 坐标 - x、y、z。

根据每个关键点的类别完成基于模型的框拟合。

这是通过获取 KITTI 训练数据集中不同对象类别的框的平均尺寸来发现的。

例如，汽车通常具有长度、宽度和高度分别为 3.6、1.5、1.8 的盒子尺寸。

下图显示了网络的架构。

数据预处理

3D 点云首先被转换为称为距离图像的 2D 表示，然后使用上面显示的 U-Net 架构进行处理。

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
硬件加速 3D 实时感知 (HARP-3D)

硬件加速 3D 实时感知 (HARP-3D)使用在 ULTRA96V2 上运行的深度神经网络在 LiDAR 点云中进行 3D 对象检测的端到端演示。本项目用到的东西Ultra96-V2绪论理念感知是自动驾驶中的一项关键任务，并且可能是当今技术界讨论最多的话题之一。简单来说，感知是理解数据的任务。这些数据通常由各种传感器生成，例如相机、雷达、激光雷达等。最常用的感知任务是对...
复制链接

扫一扫

Hack电子 CSDN认证博客专家 CSDN认证企业博客

码龄3年

5: 原创

-: 周排名

190万+: 总排名

67万+: 访问

: 等级

2504: 积分

491: 粉丝

695: 获赞

101: 评论

6215: 收藏

私信

关注

热门文章

最新评论

Windows中WSL2 配置运行GNOME桌面版 Ubuntu
资深可爱鉴定师: sudo gnome-session 博主哥哥，为什么执行完这个命令后，那个界面还是一直是黑的？？？
如何成长为硬件工程师
一个苦逼的中年转行者: 没有相关学历和工作经验又想往这方面转行的话该如何起步
FPGA通过native接口读写DDR3
上官云仙: 一堆废话
FPGA设计_逻辑锁定（logic lock）的简单使用
weixin_44562239: logic lock region 对话框是点哪里弹出来的呢？
Windows中WSL2 配置运行GNOME桌面版 Ubuntu
xyxskywalker: 使用wsl --export Ubuntu-24.04 F:\WSL\wsl2tar\ubuntu2404.tar打包后，注销系统，wsl --unresgister,然后解压到非系统盘， wsl --import Ubuntu-24.04 F:\WSL\ubuntu2404\ F:\WSL\wsl2tar\ubuntu2404.tar --version 2，最后 ubuntu2404.exe config --default-user vencent-skywalker 最后的那个是原来的用户名，前面的是版本号，就ok了，牢弟

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。