nvdla_investigate

最新推荐文章于 2024-05-14 07:40:00 发布

高能效智能计算

最新推荐文章于 2024-05-14 07:40:00 发布

阅读量5.1k

点赞数 4

分类专栏： bywufan 文章标签： NVDLA nvidia 英伟达加速器

本文链接：https://blog.csdn.net/weixin_42749767/article/details/83303686

版权

本文详细介绍了NVIDIA的NVDLA，一种免费的深度学习加速器，具有可扩展性和可配置性。NVDLA硬件架构包括卷积、激活引擎、池化引擎等模块，支持多种卷积模式。软件设计包括编译工具和运行环境，提供了用户模式和内核模式驱动程序。实验平台部分讲述了虚拟仿真实验的实施步骤。

摘要由CSDN通过智能技术生成

1.NVDLA简介

英伟达深度学习加速器(NVDLA)是一种免费开放式架构，NVDLA具有可扩展性，高度可配置性，旨在简化集成和可移植性。NVDLA软件生态系统包括一个设备上的软件堆栈（开源版本的一部分），一个完整的培训基础架构，用于构建包含深度学习的新模型，以及将现有模型转换为可在设备上使用的形式的解析器软件。可以提供其自己的硬件平台以及软件内核：

硬件架构：基于Xavier–全球首款专为汽车产品设计的自动处理器 - 以及完整的验证套件。
基于开放行业标准的IP核模型提供：Verilog模型是RTL形式的综合和仿真模型，TLM SystemC仿真模型可用于软件开发，系统集成和测试。

2.硬件架构

2.1硬件简介

NVIDIA®深度学习加速器（NVDLA）是一种可配置的固定功能硬件加速器，适用于深度学习应用程序中的推理操作。通过展示加速与每个CNN层相关的操作的各个构建块（例如，卷积，反卷积，完全连接，激活，池化，本地响应归一化等），为卷积神经网络（CNN）提供全硬件加速。保持独立且可独立配置的块意味着NVDLA的尺寸可以适用于许多较小的应用。
NVDLA架构中的每个块都支持特定的操作，这些操作对于深度神经网络的推理是不可或缺的。推理操作分为五组：

卷积运算（卷积核心和缓冲区块）
卷积模式有很多种支持：直接卷积、图像输入卷积模式、Winograd卷积模式、批量卷积模式、卷积缓冲区
单数据点操作（激活引擎块）
单数据点操作支持：线性函数、非线性函数
平面数据操作（池化引擎块）
池化功能支持：maximum-pooling - 从池窗口获取最大值、最小池 - 从池窗口获取最小值、average-pooling - 池化窗口中的特征值的平均值
多平面操作（本地和标准块）
数据存储器和重塑操作（重塑和桥接DMA模块）
桥DMA（

最低0.47元/天解锁文章

高能效智能计算

关注

4
点赞
踩
29

收藏

觉得还不错? 一键收藏
0
评论
nvdla_investigate

1.NVDLA简介英伟达深度学习加速器(NVDLA)是一种免费开放式架构，NVDLA具有可扩展性，高度可配置性，旨在简化集成和可移植性。NVDLA软件生态系统包括一个设备上的软件堆栈（开源版本的一部分），一个完整的培训基础架构，用于构建包含深度学习的新模型，以及将现有模型转换为可在设备上使用的形式的解析器软件。可以提供其自己的硬件平台以及软件内核：硬件架构：基于Xavier–全球首款专为汽车...
复制链接

扫一扫

专栏目录