使用DLA
11.使用DLA
NVIDIA®DLA™(深度学习加速器)是用于深度学习操作的固定功能加速器引擎。 DLA旨在进行卷积神经网络的完整硬件加速。 DLA支持各种层,例如卷积,解卷积,完全连接,激活,合并,批处理规范化等。
有关NVIDIA®TensorRT™层中DLA支持的更多信息,请参阅DLA支持的层。 trtexec工具具有其他参数,可在DLA上运行网络,请参阅trtexec。
要在FP16模式下使用trtexec在DLA上运行AlexNet网络,请发出:
./trtexec --deploy=data/AlexNet/AlexNet_N2.prototxt --output=p
本文档介绍了如何在TensorRT中利用DLA(深度学习加速器)进行推理,包括在DLA上运行网络的配置方法,如设置DeviceType、使用sampleMNIST示例,以及DLA支持的层和GPU后备模式。DLA主要用于加速卷积神经网络,支持FP16和INT8模式,但有特定的层限制和最大批次大小。
订阅专栏 解锁全文
2248

被折叠的 条评论
为什么被折叠?



