用NVIDIV Visual Profiler 进行分析执行效果

最新推荐文章于 2024-08-10 02:25:01 发布

NYG8945

最新推荐文章于 2024-08-10 02:25:01 发布

阅读量1.5k

点赞数

分类专栏： CUDA学习日记文章标签： cuda 多线程 nvidia

本文链接：https://blog.csdn.net/NYG8945/article/details/52964291

版权

先附上代码，这是上次进行多线程运算的程序。
不同的是最后多了行代码：
cudaThreadExit(); //加上这个可以用 NVIDIA visual profiler进行分析
这行代码是保证分析时进行判断是否运行完的，不然分析软件一直会在分析GPU的运行状态，产生无用的垃圾信息。

下面是要分析的多线程程序

//GPGPU编程技术-从GLSL、CUDA到OpenCL  平方和算法第一版 增加计时函数 没有为主机变量分配内存 //
//书中程序160页
#include <stdio.h>
#include <iostream>
#include <cuda_runtime.h> // For the CUDA runtime routines (prefixed with "cuda_")
#include <device_launch_parameters.h> //我在查询中找到的头文件 有可能有别的表达方式
#include <time.h> //计时用的函数库