文章目录
前言
学习我的教程专栏,你将绝对能实现CUDA工程化,实现环境安装、index计算、kernel核函数编程、内存优化与steam性能优化、原子操作、nms的cuda算子、yolov5的cuda部署等内容,并开源教程源码。
恭喜朋友们,你们能跟着我的cuda教程学到这里,你们已然掌握cuda编写自己算子,也学了具有代表意义的NMS算子。你们应当已走进cuda编程世界了,后期各位技术高低全然在于各自熟练与进一步深度挖掘,我也不在过多列举太多无意义的列子分享大家。于是,我将带领大家如何使用cuda部署yolov5的算法,也会涉及到tensorrt相关内容,介于我不太清楚各位现有技术能力,我将介绍基于tensorrt的yolov5模型部署,也会涉及到一些tensorrt相关知识,主要分为三个部分内容,内容一基于onnx的yolov5部署的tensorrt介绍,内容二基于cpu部署onnx的yolov5模型介绍,主要介绍如何使用C++构建前后处理逻辑,内容三基于cuda部署的yolov5模型介绍
,主要介绍如何使用cuda构建前后处理逻辑及device端内部处理过程,也是最重要内容。介于内容独创,前2个内容代码开源,后一个内容链接可在文章中获取
。
专栏概括
1、cuda教程目录
第一章 指针篇–>点击这里
第二章 CUDA原理篇–>