通过GPU Coder™能为深度学习、嵌入式视觉、自动化系统/自动驾驶等领域,从Matlab代码生成的优化CUDA代码。
本例子是让你了解如何让生成的代码调用优化NVIDIA®CUDA库,并以源代码、静态库,或动态库集成到你的项目。它也可以用于gpu的原型平台,如NVIDIA Tesla®和NVIDIA Tegra®。
在例子中,使用了一个基于YOLO架构的深度学习神经网络的实时对象检测算法。这个单一的神经网络在一次评估中直接从输入图像预测边界框和类概率。如果概率超过某个阈值,则用一个边界框标识对象。
使用cnncodegen函数,可以为神经网络生成CUDA代码,然后将生成的代码集成到更大的应用程序中。主函数使用OpenCV API读取输入图像,并用边框显示输出图像。使用此工作流,您可以在嵌入式GPU目标如杰森Tegra或驱动™PX平台部署您的深度学习算法。
本视频相关资源:
NVIDIA GPU Support from GPU Coder
Neural Network Toolbox(TM) Importer for TensorFlow-Keras Models
Neural Network Toolbox Importer for Caffe Models:
更多Matlab与Jetson教程:
利用Matlab GPU Coder在NVIDIA Jetson平台上构建原型(中文字幕)