nvdla学习笔记_NVDLA 深度学习推理编译器现已开源

最新推荐文章于 2022-11-20 09:04:06 发布

weixin_39639550

最新推荐文章于 2022-11-20 09:04:06 发布

阅读量709

点赞数

文章标签： nvdla学习笔记

本文链接：https://blog.csdn.net/weixin_39639550/article/details/111506644

版权

NVIDIA开源了NVDLA深度学习推理编译器，提供完全开放的软硬件推理平台源代码。编译器优化执行图，最大化硬件利用率并减少数据移动，为不同规模的神经网络提供高性能和能效。用户可以利用编译器进行定制化层调整，以适应特定用例或实验前沿算法。借助FireSim和RISC-V，用户可以在云端进行设计和性能评估。

摘要由CSDN通过智能技术生成

为深度学习设计新的定制化硬件加速器，是件备受广大开发者欢迎的事情，但是如想要这种新的设计能够同时实现最先进的性能和效率，却是一项复杂且具有挑战性的难题。

两年前，NVIDIA为NVIDIA深度学习加速器(NVIDIA Deep Learning Accelerator，NVIDIA Jetson AGX Xavier开发工具包中，为AI提供了最佳峰值为7.9 TOPS/W的效率。随着NVDLA在GitHub上的优化编译器的开源发布，系统架构师和软件团队现在已经拥有了世界上第一个完全开放的软硬件推理平台的完整源代码。

本文将解释网络图形编译器在实现专用硬件加速器的电源效率这一关键目标中所扮演的角色，并展示如何通过在云端构建和运行用户自己的自定义NVDLA软件和硬件设计开始。NVDLA Block Diagram使用NVDLA进行目标检测

NVDLA编译器的性能及效率

该编译器是NVDLA软件栈的关键组件。它生成优化的执行图，将预先训练的神经网络模型层中定义的任务映射到NVDLA中的各个执行单元。它在最大限度地利用计算硬件的同时，尽可能地减少数据移动。

NVDLA核心硬件有六个专门的硬件单元，它们可以同时调度，也可以在流水线配置中调度。它还具有小型和大型硬件配置文件。大的配置文件包括先进的功能，如芯片上的SRAM接口和附加一个微控制器的能力。硬件架构是模块化的，它的设计具有可拓展性，从小型嵌入式物联网设计到使用NVDLA单元阵列的大型数据中心类芯片。编译器可以根据各种选择的因素进行调优：NVDLA硬件配置、系统的CPU和内存控制器配置，以及应用程序的自定义神经网络用例(如果需要的话)。NVDLA

最低0.47元/天解锁文章

weixin_39639550

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
nvdla学习笔记_NVDLA 深度学习推理编译器现已开源

为深度学习设计新的定制化硬件加速器，是件备受广大开发者欢迎的事情，但是如想要这种新的设计能够同时实现最先进的性能和效率，却是一项复杂且具有挑战性的难题。两年前，NVIDIA为NVIDIA深度学习加速器(NVIDIA Deep Learning Accelerator，NVIDIA Jetson AGX Xavier开发工具包中，为AI提供了最佳峰值为7.9 TOPS/W的效率。随着NVDLA在Gi...
复制链接

扫一扫