nvdla_investigate

本文详细介绍了NVIDIA的NVDLA,一种免费的深度学习加速器,具有可扩展性和可配置性。NVDLA硬件架构包括卷积、激活引擎、池化引擎等模块,支持多种卷积模式。软件设计包括编译工具和运行环境,提供了用户模式和内核模式驱动程序。实验平台部分讲述了虚拟仿真实验的实施步骤。
摘要由CSDN通过智能技术生成

1.NVDLA简介

英伟达深度学习加速器(NVDLA)是一种免费开放式架构,NVDLA具有可扩展性,高度可配置性,旨在简化集成和可移植性。NVDLA软件生态系统包括一个设备上的软件堆栈(开源版本的一部分),一个完整的培训基础架构,用于构建包含深度学习的新模型,以及将现有模型转换为可在设备上使用的形式的解析器软件。可以提供其自己的硬件平台以及软件内核

  • 硬件架构:基于Xavier–全球首款专为汽车产品设计的自动处理器 - 以及完整的验证套件。
  • 基于开放行业标准的IP核模型提供:Verilog模型是RTL形式的综合和仿真模型,TLM SystemC仿真模型可用于软件开发,系统集成和测试。

2.硬件架构

2.1硬件简介

NVIDIA®深度学习加速器(NVDLA)是一种可配置的固定功能硬件加速器,适用于深度学习应用程序中的推理操作。通过展示加速与每个CNN层相关的操作的各个构建块(例如,卷积,反卷积,完全连接,激活,池化,本地响应归一化等),为卷积神经网络(CNN)提供全硬件加速。保持独立且可独立配置的块意味着NVDLA的尺寸可以适用于许多较小的应用。
NVDLA架构中的每个块都支持特定的操作,这些操作对于深度神经网络的推理是不可或缺的。推理操作分为五组:

  • 卷积运算(卷积核心和缓冲区块)
    卷积模式有很多种支持:直接卷积、图像输入卷积模式、Winograd卷积模式、批量卷积模式、卷积缓冲区
  • 单数据点操作(激活引擎块)
    单数据点操作支持:线性函数、非线性函数
  • 平面数据操作(池化引擎块)
    池化功能支持:maximum-pooling - 从池窗口获取最大值、最小池 - 从池窗口获取最小值、average-pooling - 池化窗口中的特征值的平均值
  • 多平面操作(本地和标准块)
  • 数据存储器和重塑操作(重塑和桥接DMA模块)
    桥DMA(
  • 4
    点赞
  • 29
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值