使用DLA
11.使用DLA
NVIDIA®DLA™(深度学习加速器)是用于深度学习操作的固定功能加速器引擎。 DLA旨在进行卷积神经网络的完整硬件加速。 DLA支持各种层,例如卷积,解卷积,完全连接,激活,合并,批处理规范化等。
有关NVIDIA®TensorRT™层中DLA支持的更多信息,请参阅DLA支持的层。 trtexec工具具有其他参数,可在DLA上运行网络,请参阅trtexec。
要在FP16模式下使用trtexec在DLA上运行AlexNet网络,请发出:
./trtexec --deploy=data/AlexNet/AlexNet_N2.prototxt --output=p