高性能编程|GPU编程
文章平均质量分 53
GPU编程
澄鑫
不断重复,百炼成钢!
展开
-
【CUDA,TensorRT】cuda,cudnn,TensorRT官方下载链接
各版本cuda下载链接各版本cudnn下载链接原创 2024-01-25 21:53:09 · 131 阅读 · 0 评论 -
【TensorRT】DeviceToHost同步与异步拷贝的区别及带来的问题
使用tensorRT推理MaskRCNN时,在执行推理完毕后,将device的指针指向的内容拷贝给host的指针时,如果此时使用cudaMemcpyAsync来进行拷贝,会随机的出现推理结果错乱的问题(观察后发现即上一张推理的结果,会在第二张的输入上呈现)。如果我们有多个核函数,并且我们创建了一个stream,那么这些核函数在stream中都是串行执行的,但是如果我们需要并发执行,可以开启多个stream。在cuda中,一个stream是由主机代码发布的一系列在设备上执行的操作,是严格保序执行的。原创 2024-01-15 13:09:31 · 513 阅读 · 0 评论 -
【GPU编程】Visual Studio创建基于GPU编程的项目
vs基于GPU编程项目的创建原创 2023-09-21 10:48:17 · 1679 阅读 · 0 评论 -
【GPU高性能编程CUDA实战】中的头文件下载
头文件源码下载原创 2023-09-20 10:41:39 · 219 阅读 · 0 评论