第五章 kernel索引(index)篇
学习我的教程专栏,你将绝对能实现CUDA工程化,实现环境安装、index计算、kernel核函数编程、内存优化与steam性能优化、原子操作、nms的cuda算子、yolov5的cuda部署等内容,并开源教程源码。在上章节中,我们已使用了核函数global方法,但cuda编程并非如此简单,而往往多数读者会被grid block thread等相关问题难住。恰巧这些问题也会伴随kernel函数始终,也是kernel函数最为重要且核心部分(我个人认为)。
复制链接